Matthias Meiler, 

Martin Siefkes (Hrsg.) 
LINGUISTISCHE 
METHODENREFLEXION 
IM AUFBRUCH 


BEITRÄGE ZUR AKTUELLEN DISKUSSION IM 
SCHNITTPUNKT VON ETHNOGRAPHIE UND, 
DIGITAL HUMANITIES, MULTIMODALITÄT 
UND MIXED METHODS j 


iM ! £: 


LINGUISTIK - IMPULSE & TENDENZEN 


Linguistische Methodenreflexion im Aufbruch 


Linguistik - 
Impulse & Tendenzen 


Herausgegeben von 
Susanne Günthner, Wolf-Andreas Liebert 
und Thorsten Roelcke 


Mitbegründet von Klaus-Peter Konerding 


Band 107 


Linguistische 
Methodenreflexion 
im Aufbruch 


Beiträge zur aktuellen Diskussion im Schnittpunkt von 
Ethnographie und Digital Humanities, Multimodalität 
und Mixed Methods 


Herausgegeben von 
Matthias Meiler und Martin Siefkes 


DE GRUYTER 


Die freie Verfügbarkeit der E-Book-Ausgabe dieser Publikation wurde durch 40 wissenschaftliche 
Bibliotheken und Initiativen ermöglicht, die die Open-Access-Transformation in der Germanistischen 
Linguistik fördern. 


ISBN 978-3-11-104299-2 

e-ISBN (PDF) 978-3-11-104361-6 

e-ISBN (EPUB) 978-3-11-104436-1 

ISSN 1612-8702 

DOI https://doi.org/10.1515/9783111043616 


I@)er__| 
Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz. 
Weitere Informationen finden Sie unter http://creativecommons.org/licenses/by/4.0. 


Die Creative Commons-Lizenzbedingungen für die Weiterverwendung gelten nicht für Inhalte (wie 

Grafiken, Abbildungen, Fotos, Auszüge usw.), die nicht im Original der Open-Access-Publikation ent- 
halten sind. Es kann eine weitere Genehmigung des Rechteinhabers erforderlich sein. Die Verpflich- 
tung zur Recherche und Genehmigung liegt allein bei der Partei, die das Material weiterverwendet. 


Library of Congress Control Number: 2023933609 


Bibliografische Information der Deutschen Nationalbibliothek 

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen 
Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über 
http://dnb.dnb.de abrufbar. 


© 2023 bei den Autorinnen und Autoren, Zusammenstellung © 2023 Matthias Meiler und 
Martin Siefkes, publiziert von Walter de Gruyter GmbH, Berlin/Boston. 


Dieses Buch ist als Open-Access-Publikation verfügbar über www.degruyter.com. 


Einbandabbildung: Marcus Lindström/istockphoto 
Druck und Bindung: CPI books GmbH, Leck 


www.degruyter.com 


Open-Access-Transformation in der Linguistik 


Open Access für exzellente Publikationen aus der Germanistischen Linguistik: Dank der Unterstützung 
von 40 wissenschaftlichen Bibliotheken und Initiativen können 2023 insgesamt neun sprachwissen- 
schaftliche Neuerscheinungen transformiert und unmittelbar im Open Access veröffentlicht werden, 
ohne dass für Autorinnen und Autoren Publikationskosten entstehen. 


Folgende Einrichtungen und Initiativen haben durch ihren Beitrag die Open-Access-Veröffentlichung 
dieses Titels ermöglicht: 


Dachinitiative „Hochschule.digital Niedersachsen“ des Landes Niedersachsen 
Universitätsbibliothek Augsburg 

Freie Universität Berlin 

Staatsbibliothek zu Berlin - Preußischer Kulturbesitz 

Technische Universität Berlin / Universitätsbibliothek 

Universitätsbibliothek der Humboldt-Universität zu Berlin 

Universität Bern 

Universitätsbibliothek Bielefeld 

Universitätsbibliothek Bochum 

Universitäts- und Landesbibliothek Bonn 

Staats- und Universitätsbibliothek Bremen 

Universitäts- und Landesbibliothek Darmstadt 

Sächsische Landesbibliothek - Staats- und Universitätsbibliothek Dresden 
Universitätsbibliothek Duisburg-Essen 

Universitäts- und Landesbibliothek Düsseldorf 

Universitätsbibliothek Eichstätt-Ingolstadt 

Universitätsbibliothek Johann Christian Senckenberg, Frankfurt a. M. 
Albert-Ludwigs-Universitat Freiburg - Universitätsbibliothek 

Niedersächsische Staats- und Universitätsbibliothek Göttingen 

Fernuniversität Hagen, Universitätsbibliothek 

Gottfried Wilhelm Leibniz Bibliothek - Niedersächsische Landesbibliothek, Hannover 
Technische Informationsbibliothek (TIB) Hannover 

Universitätsbibliothek Hildesheim 

Universitätsbibliothek Kassel - Landesbibliothek und Murhardsche Bibliothek der Stadt Kassel 
Universitäts- und Stadtbibliothek Köln 

Université de Lausanne 

Zentral- und Hochschulbibliothek Luzern 

Bibliothek des Leibniz-Instituts für Deutsche Sprache, Mannheim 
Universitätsbibliothek Marburg 

Universitätsbibliothek der Ludwig-Maximilians-Universität München 
Universitäts- und Landesbibliothek Münster 

Bibliotheks- und Informationssystem (BIS) der Carl von Ossietzky Universität Oldenburg 
Universitätsbibliothek Osnabrück 

Universität Potsdam 

Universitätsbibliothek Trier 

Universitätsbibliothek Vechta 

Herzog August Bibliothek Wolfenbüttel 

Universitätsbibliothek Wuppertal 

ZHAW Zürcher Hochschule für Angewandte Wissenschaften, Hochschulbibliothek 
Zentralbibliothek Zürich 


Inhalt 


Matthias Meiler, Martin Siefkes 
Hauptlinien der aktuellen Methodendiskussionen und Potenziale ihrer 
Verflechtung — 1 


Teill: Methodologische Reflexion der Erfassung, Analyse 
und Integration heterogener Daten 


Arne Krause, Jonas Wagner 
Transkription mehrsprachiger Videodaten: Von der Erhebung bis zur 
Analyse — 15 


Matthias Meiler 
Method(olog)ische Herausforderungen der Analyse sprachlichen Handelns in 
kommunikativen Praktiken — 45 


John A. Bateman, Chiao-| Tseng 
Linguistik und Multimodalitat — 79 


Teil Il: Interaktionsbedingungen als methodologische 
Herausforderung 


Karola Pitsch 
Mensch-Roboter-Interaktion als Forschungsinstrument der Interaktionalen 
Linguistik — 119 


Maximilian Krug 
Ohne Sprache keine Teilnehmendeninterpretation? — 153 


Sascha Wolfer, Andrea Abel, Aivars Glaznieks, Maja Linthe 
Ausgangspunkte für die Betrachtung von Textqualität im digitalen 
Zeitalter — 181 


Vill — Inhalt 


Teil III: Methodologische Reflexion interdisziplinärer 
Analysekategorien 


Eilika Fobbe 
Linguistik und psychologische Täuschungsforschung — 205 


Simon Meier-Vieracker, Catharina Vögele 
Mixed Methods in der digitalen Gerüchteforschung — 235 


Philipp Dreesen, Julia Krasselt, Maren Runte, Peter Stücheli-Herlach 
Operationalisierung der diskurslinguistischen Kategorie ‚Akteur‘ — 263 


Teil IV: Linguistische Methodendiskussion im Aufbruch 


Martin Siefkes, Matthias Meiler 
Methodologische Diskussion: drei Herausforderungen und fünf 
Respondenzen — 297 
Respondenz von Simon Meier-Vieracker & Catharina Vögele — 306 
Respondenz von Maximilian Krug — 308 
Respondenz von Philipp Dreesen & Julia Krasselt — 310 
Respondenz von Eilika Fobbe — 313 
Respondenz von John A. Bateman & Chiao-I Tseng — 315 


Matthias Meiler, Martin Siefkes 
Zwölf Thesen zur linguistischen Methodendiskussion — 319 


Index — 325 


Matthias Meiler, Martin Siefkes 

Hauptlinien der aktuellen Methoden- 
diskussionen und Potenziale ihrer 
Verflechtung 


Zur Einleitung in den Band 


In der linguistischen Diskussion der 1970er Jahre wehte ein Wind des Aufbruchs. 
Diesen Wind unter dem Label „pragmatische Wende“ anzusprechen, wirdihmin 
verschiedener Hinsicht nicht gerecht, wenn darin vielleicht auch ein entschei- 
dender, auslösender Flügelschlag angesprochen ist. In seiner Folge wurde die 
Sprachwissenschaft als solche ganz grundsätzlich in ihrer überkommenen Ver- 
fasstheit problematisiert. Exemplarisch seien hier die Sammelbände Sprachtheo- 
rie (hrsg. v. Schlieben-Lange 1975a), Methodologie der Sprachwissenschaft (hrsg. 
v. Schecker 1976b), Gegenstand und Wahrheit (hrsg. v. Dittmann et al. 1976) sowie 
Wissenschaftstheorie der Linguistik (hrsg. v. Wunderlich 1976) genannt. Darin 
wird geradezu nach Sturm gerufen, wenn etwa Schlieben-Lange (1975b) einlei- 
tend feststellt: 


Zwar scheint die „Linguistik“ (und damit ist vor allem die deutsche Ausprägung der trans- 
formationellen Grammatik gemeint) dem Außenstehenden äußerst „theoretisch“ (was für 
ihn wohl synonym ist mit „praxisfern“). In Wahrheit aber hat eine Theoriediskussion, wie 
sie andere Wissenschaften durchgestanden haben (der Hinweis auf den Positivismusstreit 
der Soziologie scheint fast zu aufdringlich), in der modernen Sprachwissenschaft noch 
nicht stattgefunden. Was nach außen hin als theoretisches Niveau schreckt, entspricht 
weithin der Bewußtlosigkeit im Selbstverständnis der Linguisten. (Schlieben-Lange 
1975b: 7) 


Angestoßen durch „ganz verschiedenartige Prozesse, die über innerlinguistische 
Entwicklungen weit hinausgehen und teilweise gesamtgesellschaftlichen oder 
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sogar globalen Charakter haben“ (Hartung 1987: 276),' wurde unter Linguist*in- 
nen in dieser Zeit die wissenschaftstheoretische Selbstverortung rege diskutiert 
und mithin eine Auseinandersetzung um den Charakter und Anspruch linguisti- 
scher Theorie und Empirie (u.a. in den genannten Bänden) geführt: Etablierte 
Modellvorstellungen - im Sinne der Auffassungen davon, was Sprache ist - und 
die daran sich knüpfenden Beschreibungs- bzw. Erklärungs- und natürlich auch 
Methoden-Erfordernisse wurden infrage gestellt. „Werde dir über die Modellvor- 
stellung klar, die deinen Spracherklärungen zugrunde liegt!“ formuliert Finke 
(1976: 44) emphatisch eine der Normen jeder spezifisch linguistischen Wissen- 
schaftskommunikation. Strukturerklärungen von Sprache wurden mit (noch zu 
entwickelnden) Funktionserklärungen von Sprache zu vermitteln gesucht (vgl. 
Kanngießer 1976: 75 f.). Der Status linguistischer Daten und so konträrer Erhe- 
bungsmethoden wie der Introspektion (vgl. Bartsch 1976: 79 f.) oder der Ethno- 
graphie (vgl. Schlieben-Lange 1976), ja die Frage, ob Linguistik und ihr vermeint- 
licher Kern, die Grammatik, überhaupt empirisch sein könne (vgl. Itkonen 1976), 
ebenso wie eine Neupositionierung des Verstehens innerhalb der linguistischen 
Methodologie (vgl. Trabant 1975; Schecker 1976a: 10-14), die Beziehung zwi- 
schen Sprache und Handeln (vgl. Lorenz 1976; Dittmann 1976b), zwischen Spra- 
che und Gemeinschaft (vgl. Wandruszka 1975; Schnelle 1976) sowie jene zu den 
(wie man damals noch sagte) nichtverbalen Zeichen (vgl. Lange-Seidl 1975) - all 
dieses und weiteres wurde aus dem Schatten des fraglos Vorausgesetzten und 
Immer-schon-Geklärten geholt, um es im Lichte gemeinsamer Auseinanderset- 
zung zu erklären. In seiner Breite kann dieser ertrag- und einflussreichen Phase 
linguistischen Denkens hier natürlich nicht entsprochen werden. 

Eine Wende hat die Linguistik als Ganze freilich nicht gemacht - auch keine 
„pragmatische“. So konstatiert auch Feilke (2000) - gerade angesichts wissen- 


1 Hartung (vgl. 1987: 276 f.) führt etwa die folgenden ‚extralinguistischen‘ Punkte an: Die Her- 
ausforderungen des Fremdsprachenunterrichts und der automatischen Sprachverarbeitung 
überforderten traditionelle linguistische Ansätze und führten zur Etablierung der angewandten 
Linguistik und zu Fragestellungen pragmatischer und soziolinguistischer Art. Während des Kal- 
ten Krieges wurden auf beiden Seiten des sog. eisernen Vorhangs Reflexionen über die politische 
Rolle von Kommunikation und des Zusammenhangs von Sprache und Gesellschaft provoziert 
bzw. forciert. Für den ‚intralinguistischen‘ Zusammenhang konstatiert er: „In den damals domi- 
nierenden Paradigmen mit ihrer weitgehend unabhängigen Modellierung sprachlicher (gram- 
matischer) Strukturiertheit waren die [...] Grunderkenntnisse allenfalls in einer sehr allgemeinen 
Form integrierbar, während die konkrete Behandlung mehr oder weniger unbefriedigend und 
künstlich blieb. Diese Bereiche stellten deshalb so etwas wie potentielle Anomalien dar [...]“ 
(ebd., 276). Apels (1972) Fallstudie zu Chomskys Sprachtheorie ist dafür wohl ein einflussreiches 
Exempel. 
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schaftsgeschichtlicher Einseitigkeit, ja „Unbedarftheit“ (ebd.: 67) in der damali- 
gen Bezugnahme auf einschlägige Vorarbeiten - dass die „Wende [...] theoretisch 
und grundbegrifflich hinter Vorleistungen pragmatischen Denkens in der 
Sprachtheorie zurtick[bleibt], und zwar sowohl im Blick auf den sprachkonstitu- 
ierenden als auch im Blick auf den sozial konstitutiven Charakter sprachlichen 
Handelns“ (ebd.: 66). Auch dies dürfte dazu geführt haben, dass neben dem ra- 
dikaleren „perspective view“ der sog. „component view of pragmatics“ (Jucker 
2012: 501 f.) letztlich stärker hat verfangen können. Die zweitgenannte Pragma- 
tik-Auffassung ordnet Jucker (2012) v.a. der anglo-amerikanischen Forschungs- 
community zu, welche in der „Wende-Zeit“ auch noch die sogenannten Linguis- 
tics Wars (Harris 1993) austrug.’ In ihrer Folge dürfte sie dann aus einem 
Zwischenspiel methodologischer Unbedarftheit erwacht sein, wie Labov (1972) 
u.a. angesichts der sich rasant entwickelnden Soziolinguistik und im Rückblick 
auf den Amerikanischen Strukturalismus feststellt: 


Less than twenty years divide us from the time when the study of methods was the reigning 
passion of American linguistics; yet the status of methodology has fallen so fast and so far 
that it now lies in that outer, extra-linguistic darkness where we have cast speculation on 
the origin of language and articles about slang. 


Das Beharrungsvermögen überkommener Paradigmen erweist sich insbesondere 
in den Geistes- und Kulturwissenschaften in vielen Punkten als resistent gegen 
wohlbegründete Kritik, gerade auch im Hinblick auf Grundsatzfragen. Nichtsdes- 
totrotz sind von der oben nur ausschnitthaft umrissenen Aufbruchsstimmung 
entscheidende Impulse in die linguistische Beschäftigung mit Sprache eingegan- 
gen, die zu einem breiten Spektrum alternativer Konzeptionen von Sprache, 
Grammatik und Sprachforschung geführt haben, sowie nicht zuletzt zur Erschlie- 
Bung linguistischer Gegenstände jenseits der (Satz-)Grammatik und ihrer festen 
Verankerung im disziplinären Gefüge. 

Eine Verstetigung der methodologischen und methodischen Diskussionen - 
zumal eine, die mit Blick auf das Fach als Ganzes geführt würde, wie sie sich etwa 
durch die Einrichtung von Methodenlehrstühlen in den Sozialwissenschaften 


2 Demgegenüber ist die sowjetische Sprachwissenschaft in einer Art Rückbesinnung auf und 
zugleich Kritik an der vergleichenden Sprachwissenschaft des 19. Jahrhunderts (u.a. jener eines 
Baudouin de Courtenay) in dieser Zeit dabei, nach Stalins Sprachschrift und der damit verbun- 
denen Entthronung des Marrismus sich auf empirische Sprachwirklichkeit allererst einlassen zu 
können und das Verhältnis von Sprache und Gesellschaft (z.B. im Rahmen der Theorie der 
Sprechtätigkeit von A.A. Leontjew) ergebnisoffen adressieren zu können (vgl. Bruche-Schulz 
1984: 134-144). 
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etablierte - hat sich im Anschluss an die 1970er Jahre bedauerlicherweise nicht 
ergeben. So, wie sich die Sprachwissenschaft ausdifferenzierte und nicht zuletzt 
interdisziplinär unterschiedlich ausrichtete, wurden und werden Methodenfra- 
gen in der Regel nur mit Blick auf einzelne Ansätze und konkrete Forschungsvor- 
haben gestellt und beantwortet, also beispielsweise strukturell, kognitiv, sozial, 
pragmatisch, medial, kulturell, multimodal oder in Kombinationen dieser Per- 
spektiven. 

Darüber gerieten das Gesamtbild und sein Zusammenhang wieder aus dem 
Blick. Den einzelnen, sich entwickelnden Subdisziplinen wurden mit ihren je un- 
terschiedlichen Methoden auch unterschiedliche Auffassungen von Sprache zu- 
gestanden, die scheinbar unbefragt auf ihre Kombinierbarkeit oder Widersprüch- 
lichkeit nebeneinander stehen können. So hat jede sogenannte Bindestrich-Lin- 
guistik ihre eigenen Methoden und internen methodologischen Auseinanderset- 
zungen entwickelt, die in Einführungen und Handbüchern vorgestellt und doku- 
mentiert sind. Dies ist gewiss auch insofern legitim, als sich die Untersuchungs- 
fragen dieser Teildisziplinen mitunter auf bestimmte Beschreibungsebenen und 
damit verbundene Fragestellungen der Sprachbeschreibung konzentrieren und 
dafür über dazu passende Untersuchungsmethoden und Auswertungsverfahren 
verfügen müssen. Problematisch erscheint jedoch, dass die jeweilige Position der 
so verstandenen „Teiluntersuchungsverfahren“ innerhalb einer (eben noch nicht 
erreichten) methodologischen Gesamtsicht der Linguistik nicht reflektiert wer- 
den, was jenes wünschenswerte Unterfangen erheblich erschwert, die Bezüge der 
Methodologien der Bindestrich-Linguistiken untereinander zu klären. 

Dass die Methodenreflexion bislang noch häufig als arbeitsteilig zu klärende 
Frage der einzelnen linguistischen Teildisziplinen gilt, wird auch daran deutlich, 
dass bisher noch kein HSK-Band zu Methodologie und Methoden vorliegt. Metho- 
dendarstellungen, die einen systematischen Anspruch haben, sind ebenso selten 
(vgl. jedoch Schlobinski 1996) wie historische Rekonstruktionen des methodolo- 
gischen Selbstverständnisses der Sprachwissenschaft (vgl. Bartschat 1996, Hel- 
big 1988). Eine Zusammenführung von beidem ist kaum zu finden.’ 


3 Natürlich gibt es Linguist*innen wie beispielsweise Konrad Ehlich, Ludwig Jäger, Clemens 
Knobloch oder Brigitte Schlieben-Lange (u.a.), die immer wieder Studien vorgelegt haben, wel- 
che insbesondere die Geschichte von Sprachauffassungen und ihre Rolle für die Theoriege- 
schichte der Sprachwissenschaft herausgearbeitet haben. Diese argumentieren aber, ähnlich 
wie Bartschat (1996) oder Helbig (1988) i.d.R. in deutlicher Distanz zu konkreten methodischen 
Fragen und verbleiben eher auf der Ebene einer allgemeinen Methodologie, während demgegen- 
über Publikationen zu konkreten Methoden häufig die wichtigen Implikationen für die Gegen- 
standskonstitution nicht diskutieren (s. Schlobinski 1996; Müller-Spitzer et al. 2022). 
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Eine intensive, grundsätzliche und vergleichende Auseinandersetzung um 
das Phänomen ‚Sprache‘, seine begriffliche Erfassung und methodische Einho- 
lung, wie sie in den 1970er Jahren geführt wurde, ist noch nicht wieder in Gang 
gekommen. Unseres Erachtens wäre sie jedoch in mancher Hinsicht geboten und 
scheint auch gewissermaßen ‚in der Luft zu liegen‘. Nicht zuletzt aus dieser Über- 
zeugung heraus haben wir Herausgeber auf dem GAL-Kongress 2018 an der Uni- 
versität Duisburg-Essen ein auf die Aktualisierung und - soweit notwendig - 
auch auf Neufundierung zielendes Methoden-Panel organisiert und davon aus- 
gehend den vorliegenden Band konzipiert, der neben den Artikeln zu den Esse- 
ner Vorträgen auch zusätzliche Beiträge einbezieht. Unsere Motivation war nicht 
zuletzt eine Bündelung aktueller Reflexionen und Neuansätze, da sich insgesamt 
feststellen lässt, dass wichtige Diskussionspunkte der 1970er Jahre wieder aufge- 
sriffen und relevant gesetzt werden. Darüber hinaus sind es auch umfassende 
neue Entwicklungen bezüglich der Kommunikationsmedien, in denen (auch) 
Sprache eine Rolle spielt, sowie auch neue Entwicklungen bezüglich der For- 
schungsmedien, in denen softwarebasierte Analyse- und Auswertungsmöglich- 
keiten gigantische digitale Korpora bearbeitbar machen, die die Linguistik zum 
Überdenken ihrer methodologischen Grundlagen herausfordern. 

Nachdem im Laufe der letzten 50 Jahre eine immer weitere Ausdifferenzie- 
rung linguistischer Gegenstände und eine entsprechende Spezialisierung der Be- 
fassung mit ihnen zu verzeichnen war, drängt sich die Frage nach einer Rein- 
tegration des Ausdifferenzierten zunehmend (jedoch nicht erst jüngst) wieder 
auf. Denn bereits Labov (1972: 98) konstatierte resigniert: „itis unfortunately true 
enough that this goal has been abandoned“. Die Verfolgung eines solchen Ziels 
ist freilich unvermeidlich methodologischer und infolgedessen auch methodi- 
scher Natur. Die entsprechenden Wege zu diesem Ziel, die sich derzeit abzeich- 
nen, scheinen ihrerseits in zwei Richtungen auseinander zu laufen. Plakativ 
könnte man sie als „Mikro“- und „Makro“-Linien in der Methodendiskussion be- 
zeichnen. Natürlich haben beide Linien ihre spezifische Geschichte innerhalb der 
Disziplin. 

— Die Mikro-Linie (exemplarisch jüngst Deppermann et al. 2016) lässt sich 

kleinteilig auf die Praktiken und Lebenswelten der Akteur*innen ein. 
Deren Sprache und Kommunikation wird möglichst holistisch und mul- 
timodal untersucht. Wesentliche linguistische Einsichten werden dabei 
aus der intensiven (auch ethnographischen) Auseinandersetzung mit 
der Materialität (einschließlich ihrer Temporalität) der zu untersuchen- 
den Ereignisse, den Situationen ihres Vollzugs, den soziokulturellen 
Einbettungskontexten - allgemein: mit dem Feld - geschöpft. Der ver- 
stehende Nachvollzug, jene qualitative interpretative Grundoperation 
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der Hermeneutik, kann als die gemeinsame Basis dieser Linie der Me- 
thodendiskussion betrachtet werden. 

— Die Makro-Linie (exemplarisch jüngst Lobin 2018) wendet sich den em- 
pirischen Sprach- und Kommunikationsereignissen aus größerer Dis- 
tanz und mit Fokus auf ihre formal bestimmbaren Aspekte zu. Die zu 
untersuchenden Ereignisse werden als abgrenzbare und klar definierte 
Einheiten betrachtet und in tendenziell enormen Quantitäten erhoben 
und in aufwendig aufbereitete Korpora überführt. Ihre digitale Reprä- 
sentation als Daten macht sie zugänglich für statistische und algorith- 
mische Operationen unterschiedlicher Art. 


Wie bereits in der zweiten Hälfte des 20. Jahrhunderts gehen auch heute wichtige 
methodische Entwicklungen von mediengeschichtlichen Innovationen aus. War 
etwa die (Weiter-)Entwicklung der (vor allem auch mobilen) Tonbandaufzeich- 
nung eine wichtige Voraussetzung für die breite Befassung mit mündlichem 
Sprachgebrauch und Interaktion (vgl. Bergmann 1985), befeuerte die Entwick- 
lung und Verbreitung von audiovisuellen Aufzeichnungstechniken nicht nur die 
multimodale Analyse von Interaktion, sondern setzt diese, zumindest für die Ge- 
sprächs- bzw. Interaktionsanalyse, sogar als methodischen Standard. Einer ana- 
logen gesellschaftlichen Verbreitungsgeschichte, nämlich der des Personal Com- 
puters und des Internets, verdankt sich ebenso die allgemeine Digitalisierung 
aller linguistischer Methoden (bzw. ihrer Hilfsmittel) wie insbesondere auch der 
Einzug der Digital Humanities in die Sprachwissenschaften (vgl. Thaller 2017). 

Dabei ist es gerade begrüßenswert, dass sich beide Linien nicht unversöhn- 
lich gegenüberstehen, sondern einerseits mitunter dieselben Phänomene be- 
trachten und andererseits die Kombination spezifischer Methoden anstreben, um 
die Schwächen der einen Herangehensweise mit Möglichkeiten der anderen zu 
kompensieren. Ein solches Vorgehen, das unter Schlagworten wie Mixed Me- 
thods, Triangulation (Flick 2011) oder Converging Evidence (Schönefeld 2011) ver- 
handelt wird, ist seinerseits natürlich von Herausforderungen gekennzeichnet, 
die unmittelbar mit dem verbunden sind, was in den Sozialwissenschaften mit- 
unter die Performativität von Methoden genannt wird (Bassett 2010) und das z.B. 
Schüller/Mittelberg (2017: 131) mit Bezug auf Jägers (2012) Semiologie als tran- 
skriptive Gegenstandskonstitution bezeichnen. Dittmann (1976) formuliert es in 
aller Klarheit so: 


[Es] bestimmt nicht der Gegenstand die Methode, sondern die Methode bestimmt 
den Gegenstand insofern, als sie bestimmt, wie der Linguist den Gegenstand qua 
empirisches Datum in den Griff und unter den Begriff bekommt. Folglich ändert sich der 
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Gegenstand der Linguistik mit der Methodologie, aber selten wird diese Veränderung so 
explizit formuliert [...]. (Dittmann 1976a: 4; Herv. im Orig.) 


Dies führt uns zurück zu den grundsätzlicheren methodologischen Fragen: Denn 
wenn einzelne Methoden (aufgrund der in sie eingelassenen Begriffe und Theo- 
rien) immer ihre je spezifischen Gegenstände hervorbringen, stellt sich bei Me- 
thodenkombinationen umso drängender die Frage nach den möglichen Relatio- 
nierungen der mit ihnen gewonnenen Erkenntnisse. Ihre Beantwortung führt - 
im günstigen und nicht unwesentlich interdisziplinäre Anschlussfähigkeit be- 
giinstigenden Fall - unmittelbar zur Reexplikation von Auffassungen vom Phä- 
nomenbereich, die sonst häufig eher implizit in Anspruch genommen werden: 
mag das im jeweiligen Einzelfall der zugrunde gelegte Begriff von Sprache, Kom- 
munikation, Zeichen, Modalität oder anderem sein. Eine widerspruchsfreie Rela- 
tionierung der mit unterschiedlichen Methoden gewonnenen Erkenntnisse führt 
dann jedoch nicht zwangsläufig zu ihrer gegenseitigen Validierung, kann aber 
auf Basis einer integrativen Theorie zur ganzheitlichen Erhellung des betreffen- 
den Phänomens beitragen. 

In unterschiedlicher Form sind im vorliegenden Band auf den ersten Blick 
scheinbar unvereinbare Sprachauffassungen präsent. Dies hat damit zu tun, dass 
der Begriff, den man von einem Gegenstand hat, einerseits in Form einer Funda- 
ment bildenden Auffassung von diesem das methodische Design einer Studie ins- 
gesamt leiten kann oder aber andererseits in Form einer Teiltheorie lediglich die 
epistemologische Grundlage eines methodischen Teilschrittes bspw. zur Erhe- 
bung oder Analyse von Daten fruchtbar gemacht werden kann. 

So basieren im Kern alle quantitativen Methoden (v.a. aber die automati- 
schen) auf dem Behaviorismus Bloomfieldscher Prägung, welcher freilich unter 
Marginalisierung der Semantik als mentalem Phänomen nicht unwesentlich zur 
formalen Sprachbeschreibung beigetragen und z.B. formbezogene Distributions- 
analysen überhaupt erst möglich gemacht hat. In Fortführung dieser Perspektive 
hat der Amerikanische Strukturalismus insgesamt wichtige methodische Impul- 
se gegeben (vgl. Harris 1951), auf die man sich später auch gegen die empirisch 
entkoppelte Generative Grammatik zurückbesann (vgl. Bense et al. 1976). 

In jedem Fall wäre es absurd, etwa Dreesen etal., Wolfer et al. oder Meier- 
Vieracker/Vögele eine behavioristische Sprachauffassung zu unterstellen, weil 
sie u.a. Methoden zur Analyse der Distribution von Wortformen in umfangrei- 
chen Korpora nutzen. Nicht zuletzt aufgrund der Einsicht in die Beschränktheit 
dieses Sprachbegriffs sind die damit verbundenen Methoden in Mixed-Methods- 
Ansätze integriert worden, und damit z.B. ergänzt um Inhaltsanalyse, Infor- 
mant*innenbefragung und natürlich hermeneutische Analyse. Eine solche Fr- 
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weiterung ist nicht zuletzt besonders da relevant, wo es auch um angewandte 
Forschung geht. 

Eine anders gewichtete Konzentration auf die sprachliche Form oder allge- 
meiner und besser auf die diversen kommunikativen Oberflächen findet sich bei- 
spielsweise in den ethnomethodologisch fundierten Arbeiten etwa von Krug oder 
Pitsch, aber auch in der Arbeit von Fobbe. Dieser Form-Fokus setzt an der Ein- 
sicht an, dass jede Art mentaler Zustände (wie etwa Intentionen, Intersubjektivi- 
tät und allgemein auch Bedeutung) einem situativen Zuschreibungsprozess un- 
terworfen ist, der sich dem Vollzugscharakter sozialer Interaktion verdankt. 
Nicht zuletzt deswegen können wir mit Menschen ebenso wie mit Maschinen in- 
teragieren und den einen wie den anderen gegenüber lügen. 

Einer unter anderem auf Bühler und Austin zurückgehenden, strikt hand- 
lungstheoretischen Auffassung, die betont, dass aus gesellschaftlicher Koopera- 
tion nicht nur sozial verbindliche Formen, sondern auch sozial geteilte Zwecke 
hervorgehen, die mit diesen Formen bzw. kommunikativen Mitteln bearbeitet 
werden können, folgen Krause/Wagner und buchstabieren eine solche Sprach- 
auffassung für die (forschungslogisch betrachtet) frühen Schritte der Erhebung 
und Aufbereitung mehrsprachiger Videodaten aus. Auf selbem Fundament, je- 
doch praxistheoretisch geweitet, wählt Meiler einen multiperspektivischen An- 
satz, um der Aspektheterogenität kultureller Größen im Rahmen einer integrati- 
ven Theorie gerecht werden zu können. 

Nicht handlungstheoretisch, sondern in einem darstellungstheoretischen 
Rahmen der Analyse kultureller Artefakte jeglicher Art plädieren Bateman/ 
Tseng für belastbarere Studiendesigns v.a. innerhalb der linguistischen Multi- 
modalitätsforschung. Darunter verstehen sie nicht nur eine quantitativ begründ- 
bare Aussagekraft der Ergebnisse, sondern ebenso eine dafür notwendige und 
mit begrifflicher Stringenz ausformulierte Methodologie, welche als Theorie se- 
miotischer Modi — ausgearbeitet als empirisches Forschungsprogramm - vor- 
liegt. Innerhalb der semiotisch fundierten Linguistik kann diese (Methodologie 
und Methodik integrierende) Reflexion der epistemologischen Grundlagen u.E. 
als exzeptionell bezeichnet werden. Vor dem Hintergrund dieses Entwurfs plä- 
dieren die Autoren insbesondere auch für die Triangulation von interpretativen, 
experimentellen und Korpusstudien, wie dies auch von Pitsch vertreten wird.“ 

Als roter Faden ziehen sich - mal mehr im Vordergrund, mal im Hintergrund 
der Einzelbeiträge - durch den vorliegenden Band die Fragen an die Methodo- 


4 Es wird an dieser Stelle darauf verzichtet, einen umfangreicheren Überblick über die einzel- 
nen Artikel zu geben, da dieser ohnehin leicht über die den Artikeln vorgeschalteten Abstracts 
gewonnen werden kann. 
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logie, die sich aus grundlegenden methodologischen Neuerungen sowie innova- 
tiven Kombinationen von Methoden (innerhalb der Linguistik, zwischen Binde- 
strich-Linguistiken oder über Disziplinengrenzen hinweg) ergeben. Die gute 
Nachricht, die die Voraussetzung für diesen Band und viele der darin zumindest 
angetippten Diskussionen bildet, ist das hohe Maß an methodischer Innovation 
der letzten Jahre und Jahrzehnte. Vereinfacht ausgedrückt ergibt sich dieses aus 
technischer Innovation durch Computer und Internet einerseits, andererseits aus 
der nach Jahrzehnten entsprechender Forderungen schließlich doch noch auf 
breiter Front umgesetzten Interdisziplinarität konkreter Forschungsprojekte (die 
sicherlich neben der größeren Offenheit der Forschenden nicht zuletzt Verände- 
rungen in der Forschungsförderung zuzuschreiben sind). 

Zugespitzt lässt sich jedoch konstatieren: Die Methodologie hat mit dieser 
schönen neuen Methodenwelt nicht Schritt gehalten. So erfreulich die methodi- 
schen Innovationen und Fortentwicklungen sind, so lässt sich ihr erhebliches Po- 
tential für die Linguistik doch nur vollständig realisieren und gesichert etablie- 
ren, wenn sie methodologisch stärker reflektiert, fundiert und damit in ein (eben- 
falls aktualisiertes) Gesamtverständnis der Linguistik von ihrem Gegenstand, ih- 
ren Theorien, Methoden und disziplinübergreifenden Bezügen passend integriert 
werden. 

Der vorliegende Band versteht sich als ein erster, tentativer Schritt, um auf 
diesen „Hilferuf der Methodenpraxis an die Methodologie“ zu antworten. Dafür 
bringt er die Erfahrungen methodologisch reflektierender Forscher*innen aus 
verschiedenen Teilbereichen und Forschungskontexten der aktuellen Linguistik 
zusammen. Sie stehen dabei im Band nicht nur neben- bzw. nacheinander, son- 
dern konnten sich im letzten Abschnitt auch noch einmal zueinander positionie- 
ren: Den Autor*innen der Beiträge wurde die Gelegenheit gegeben, die aus den 
1970er Jahren übliche Publikationspraktik der Respondenz zu nutzen. Daraus ha- 
ben sich fünf Respondenzen unterschiedlicher Länge und thematischer Ausrich- 
tung ergeben, die in den Teil IV des Bandes aufgenommen wurden. Zwölf Thesen 
zur linguistischen Methodendiskussion beschließen den Band. 
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Teill: Methodologische Reflexion der Erfassung, 
Analyse und Integration heterogener Daten 


Arne Krause, Jonas Wagner 
Transkription mehrsprachiger Videodaten: 
Von der Erhebung bis zur Analyse 


Abstract: Die Aufbereitung von linguistischen Daten für deren Analyse ist nicht 
zuletzt durch die zunehmend einfachere Möglichkeit ihrer Erhebung durch tech- 
nische Weiterentwicklungen der Erhebungsmethoden (s. dazu etwa Schmitt 2013) 
Teil der alltäglichen Arbeit von Linguist*innen geworden. Die Aufbereitung von 
gesprochenen Daten, insbesondere von videographierten, stellt eine besondere 
Anforderung dar, da von der Erhebung bis hin zur Transkription (s. Redder 2001a 
zu einer Übersicht über unterschiedliche Transkriptionssysteme) eine Vielzahl 
von Herausforderungen bestehen. Diese multiplizieren sich in vielerlei Hinsicht, 
wenn man es mit mehrsprachigen Daten zu tun hat und sich das Erkenntnisinte- 
resse nicht auf die Sprache beschränkt, sondern systematisch auch weitere, 
nicht-sprachliche Dimensionen kommunikativen Handelns miteinbezogen wer- 
den sollen. In diesem Beitrag sollen daher sämtliche Schritte von der Datenerhe- 
bung, über die Aufbereitung für die Transkription, die Transkription sowie wei- 
tere analytische Bearbeitungen der Transkription dargestellt werden. Eine in die- 
sem Zusammenhang zu diskutierende Frage ist, welche theoretischen und gegen- 
standsbezogenen Vorannahmen in Transkriptionsentscheidungen und -syste- 
men enthalten sind oder mit diesen gesetzt werden. Als Daten zur Verdeutli- 
chung der einzelnen Schritte dienen deutsch-arabische Mathematikförderein- 
heiten, die durch diese Sprachkombination weitere methodologische Schritte 
und Entscheidungen erfordern. 


Keywords: Transkription, Mehrsprachigkeit, Videodaten, Multimodalität, 
Datenerhebung, Videographie 


1 Einleitung 


„Ohne Empirie hängt alles in der Luft. Ohne Theorie läuft alles ins Leere“ (Hoff- 
mann 2003: 118). Mit dieser Sentenz schließt Hoffmann eine umfassende, em- 
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pirisch basierte Analyse von grammatischen Strukturen des Deutschen. Am An- 
fang des vorliegenden Artikels gilt sie, Hoffmanns Position aufgreifend, gleich- 
sam als Maxime! für die funktional-pragmatische Sprachanalyse. Das Zitat macht 
auf zwei wesentliche Punkte aufmerksam, die häufig marginalisiert wurden und 
werden. 

Erstens: Eine Wissenschaft von der Sprache, die es sich zur Aufgabe macht, 
Erkenntnisse über einen Gegenstand zu gewinnen, der als wesentlicher Teil der 
gesellschaftlichen Wirklichkeit unabhängig von ihr besteht, muss sich notwen- 
digerweise in genau diese Wirklichkeit begeben, um an Daten für die Analyse zu 
gelangen. Dass sich anhand introspektiv konstituierter ‚Daten‘ keine Erkennt- 
nisse gewinnen lassen, die auf den sprachlichen Aspekt gesellschaftlicher Wirk- 
lichkeit abbildbar sind, dürfte zwar mittlerweile breiter Konsens sein (z.B. aktuell 
Lanwer 2018). Allerdings scheint diese Einsicht und die mit ihr vorgetragene For- 
derung nach der Errichtung umfangreicher Sprachkorpora mitunter eher auf die 
zunehmende Möglichkeiten der technischen Verarbeitung und Archivierung von 
(häufig v.a. schriftlichen) Sprachdaten - der sich die Linguistik unter der Gefahr 
eines zunehmenden Bedeutungsverlustes preisgibt (s. Bubenhofer 2018) - sowie 
auf die Ausrichtung von Forschungsinteressen entlang von (häufig drittmittelge- 
förderten) Forschungsprogrammen zurückzugehen, als auf ein zugrundeliegen- 
des Verständnis von Sprache. 

Zweitens: Theorie bildet nicht das Gegenstück zur Empirie. Stattdessen ste- 
hen beide in einem engen Wechselverhältnis zueinander. Theoretische Systema- 
tiken müssen anhand der Analyse empirischer Daten sowohl rekonstruiert als 
auch kritisch reflektiert werden. In diesem Sinne stellen Sprachtheorien Syste- 
matiken bereit, die empirisch gewonnene Erkenntnisse strukturieren, die Ergeb- 
nisse also überhaupt erst einschätzbar und verstehbar machen, gleichzeitig aber 
offen für eine kritische Präzisierung oder gar Revision bleiben (vgl. Redder 2017, 
2001b, Rehbein 1994). 

Dieser Punkt erlangt vor dem Eindruck einer zunehmenden Theorielosigkeit, 
wenn nicht gar -feindlichkeit linguistischen Arbeitens eine besondere Relevanz. 
Der Verzicht auf eine theoretische Einschätzung und -ordnung sprachwissen- 
schaftlicher Erkenntnisse wirkt sich in einem unvermittelten und zusammen- 
hangslosen Nebeneinander der gewonnenen Fakten fort. Dieser Umstand ist kei- 
nesfalls neu. In seiner kritischen Analyse des Leitmotivs in de Saussures Cours de 
linguistique générale, dem Spiel, stellt Ehlich (2007) einen durchaus ähnlichen 
Befund für die linguistische Praxis, vor dessen Hintergrund der Cours erschien, 


1 Siehe Ehlich & Rehbein (1977) zur wissensstrukturellen Differenzierung von ‚Sentenz‘, ‚Ma- 
xime‘ und weiteren. 
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fest: „Die Linguistik drohte sich in jener Faktenfülle zu verlieren. Die Vielfalt der 
Phänomene entzog sich immer deutlicher jedem systematischen Zugriff, welcher 
wissenschaftstheoretischen Provenienz auch immer [...]“ (ebd.: 354). Ohne Theo- 
rie läuft alles ins Leere! 

Das eingangs genutzte Zitat lässt sich also als Maxime für die linguistische 
Arbeit lesen. Die wissenschaftlich-analytische Methode wird dort allerdings nicht 
genannt. Warum nicht? 

Die Methode gesellt sich keinesfalls als Dritte im Bunde zu „Theorie“ und 
„Empirie“, sondern hat einen abgeleiteten Status. Methoden sind immer empi- 
risch-theoretisch positioniert und reflektiert — oder sollten es nach dem hier vor- 
getragenen Verständnis zumindest sein. Methoden, die dies nicht für sich in An- 
spruch nehmen, bilden dabei keine Ausnahme. Stattdessen ist in einer solchen 
Position häufig gerade die Theorielosigkeit zur Ideologie verhärtet (vgl. Redder 
2001b: 644). 

Im Gegensatz dazu scheint sich in der zeitgenössischen Linguistik ein ande- 
res Verhältnis von Theorie und Methode durchzusetzen: Eine Konzentration auf 
Methoden und Methodologien trägt zur zunehmenden Verdrängung der Theorie 
bei. Der Verzicht auf Theorie wird durch eine Konzentration auf die Methode 
kompensiert, wodurch der Zusammenhang zwischen Methode und Theorie aus 
dem Blick gerät. 

Dies ist insbesondere in solchen Zusammenhängen deutlich, in denen die 
Daten lediglich hinsichtlich ihrer Oberflächenstruktur analysiert werden, und 
tiefenstrukturelle Zusammenhänge in den Bereich der Spekulation verwiesen 
werden - ein Verfahren, das insbesondere der Konversationsanalyse sowie eth- 
nografischen Ansätzen eigen ist und die schon Flader & von Throta (1991) daher 
im Positivismus-Verdacht hatten. 

Auch dies ist nicht neu. So stellt Ehlich (2007) im Fortgang des oben ange- 
führten Zitats fest, dass es eine „scheinbare [...] Ausnahme“ vom generellen Un- 
vermögen, die erarbeiteten Phänomene systematisch zusammenzubinden, gab, 
und zwar den „positivistischen [Zugang], der freilich die tatsächliche Situation 
lediglich methodologisch ratifizierte“ (Ehlich 2007: 354). Anstelle einer systema- 
tischen, theoretisch geleiteten und theoriebildenden Ins-Verhältnis-Setzung von 
Oberflächen- und Tiefenstrukturen wird dabei lediglich einer „minutiösen Be- 
schreibung oder dem close reading [beobachtbarer Daten] Erkenntniskraft“ bei- 
gemessen (Redder 2001b: 644). 

Vor diesem Hintergrund positioniert sich dieser Artikel. Dabei konzentriert 
er sich darauf, exemplarisch zu zeigen, wie weitreichend die Zusammenhänge 
von Theorie und Methode sind, dass sie sich sogar bis in die scheinbar trivialsten 
Momente der linguistischen Arbeit ziehen. 
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2 Theorie und Methode 


Wissenschaftliche Methoden sind nicht theorielos, nicht unabhängig von wis- 
senschaftlichen Theorien. Gleiches gilt für die Methodologie. In die Diskussion 
von Methoden gehen notwendigerweise theoretische Erwägungen mit ein, unab- 
hängig davon, ob sie offen reflektiert werden oder ideologisch verschleiert sind. 

Methoden sind nach dem hier postulierten Verständnis Vehikel, um wissen- 
schaftliche Theorien auf empirische Daten applizierbar zu machen. Durch Metho- 
den können wissenschaftliche Theorien so einsetzbar gemacht werden, dass an- 
hand empirischer Daten neue Erkenntnisse gewonnen werden können. 
Methodologien reflektieren diese Zusammenhänge und haben dadurch selbst ei- 
nen Einfluss auf die kritische Weiterentwicklung von Theorien. 

In diesem Beitrag soll der dialektische Zusammenhang von Methoden und 
Theorien am Beispiel der Funktionalen Pragmatik (FP) verdeutlicht werden. Da- 
zu soll skizziert werden, wie die theoretischen Grundannahmen der Funktiona- 
len Pragmatik sich in methodische Aspekte im Zusammenhang mit der Gewin- 
nung, Aufarbeitung und Analyse von mündlichen Sprachdaten durchziehen. 

Nach funktional-pragmatischer Auffassung ist Sprache eine Form menschli- 
chen Handelns. Ihr liegt ein Verständnis von Sprache als Trägerin von Funktio- 
nen zugrunde, derer sich Sprecher*innen in der Interaktion mit Hörer*innen be- 
dienen, um bestimmte in der Wirklichkeit auftretende Konstellationen durch die 
handelnde Verwirklichung gesellschaftlicher Zwecke an die eigenen Bedürfnisse 
zu adaptieren (s. Ehlich & Rehbein 1979). Der Handlungscharakter von Sprache 
bildet ein zentrales theoretisches Axiom, das auch in der Analyse den Mittel- 
punkt bildet. Der Ausdruck ‚Pragmatik‘ wird also nicht in einem additiven Sinne 
verwendet, d.h. die ‚kontextuelle Einbettung‘ von Sprache wird nicht als zusätz- 
liche Information zur Analyse herangezogen (s. Ehlich 1999). Stattdessen ist das 
zentrale Erkenntnisinteresse der Funktionalen Pragmatik gerade die Erfassung 
der funktionalen Charakteristika von Sprache im Wechselverhältnis zu ihren for- 
malen Eigenschaften. 

Das funktional-pragmatische Verfahren lässt sich grundsätzlich als empi- 
risch-reflektiert verstehen. In diesem werden in einem mehrstufigen interpreta- 
tiv-verstehenden Prozess Strukturen unterschiedlicher Größenordnung (Global- 
strukturen und Detailstrukturen) zueinander ins Verhältnis gesetzt. Rehbein 
(2001) charakterisiert diesen Prozess als „zirkulär-spiralförmig“? (Rehbein 2001: 
927) durch den das „Saliente einer Transkription [...], das sich einem oberfläch- 


2 Das Verfahren lässt sich als hermeneutisches charakterisieren. 
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lichen und strukturalistisch-positivistischen Vorgehen entziehen würde, in ei- 
nem Prozess des Erkennens ermittelt [wird], der in der Rekonstruktion des Er- 
kenntnisgegenstands zu sich selbst kommt“ (Rehbein 2001: 928). 

Ein grundsätzliches Prinzip dieser Methode im Zusammenhang mit der Ana- 
lyse empirischer Sprachdaten ist die Einheitenbildung. Dabei dient der Zweck? 
als zentrale Kategorie, auf die die Rekonstruktion von Einheiten sprachlichen 
Handelns orientiert ist. 

Unterschieden wird zwischen vier Einheiten sprachlichen Handelns von un- 
terschiedlicher Größenordnung, die in einen systematischen Verhältnis zueinan- 
der stehen, insofern kleinere Einheiten sich zu größeren zusammensetzen, selbst 
aber dabei in theoretischer und methodischer Hinsicht Einheiten eigenen Rechts 
bleiben: Prozeduren, Sprechhandlungen, sprachliche Handlungsmuster und die 
Sprechhandlungsensembles Text und Diskurs (s. auch Krause & Wagner 2021 so- 
wie Redder 2005 für eine grafische Ins-Verhältnis-Setzung der sprachlichen Ein- 
heiten). 

Die Analyse sprachlicher Daten greift auf diese zentralen Einheiten zurück. 
D.h. die analyseleitenden Kategorien werden nicht aus dem Datenmaterial extra- 
hiert. Stattdessen werden theoretische Erkenntnisse methodisch nutzbar ge- 
macht und so empirisch überprüft. Dabei erschöpft sich die Methode jedoch nicht 
in einer Identifizierung von im Vorhinein festgelegten Kategorien im Material, 
wie gelegentlich unterstellt wird (z.B. Imo 2013), sondern ermöglicht die Rekon- 
struktion der funktionalen Systematik der sprachlichen Einheiten im konkreten 
Fall, also die Offenlegung von Tiefenstrukturen im Verhältnis zu ihrer Oberflä- 
chenrealisierung. Dazu werden allgemeine, theoretische Kategorien und deren 
besondere, konkrete Realisierungsformen in authentischen Diskursen in ein re- 
kursiv-hermeneutisches Verhältnis gesetzt. Auf diese Weise wird eine verste- 
hende Interpretation (vgl. Rehbein 2001) der Sprachdaten erzielt. 

Die zentralen Einheiten der Funktionalen Pragmatik haben als Kategorien ei- 
nen universellen d.h. sprachübergreifenden Charakter. Dies betrifft nicht das 
Vorliegen konkreter einzelner sprachlicher Handlungsmuster etc. in verschiede- 
nen Sprachen, sondern vorwiegend die generelle Annahme der Zweckgebunden- 
heit von Sprachen und deren Erfassbarkeit durch die Kategorien. Gerade aus die- 
sem Grund bietet die Funktionale Pragmatik eine stabile theoretische Voraus- 
setzung für sprachkomparatistische Analysen sowie die Analyse von Mehrspra- 
chigkeit. 


3 Siehe z.B. Ehlich & Rehbein (1979) oder Redder (2008) zur Bestimmung der Kategorie des 
Zwecks. 


20 — Arne Krause, Jonas Wagner 


Die Bildung von Einheiten als methodischem Prinzip charakterisiert nicht 
nur die konkrete analytische Arbeit, sondern auch die ihr vorausgehenden Etap- 
pen, wie die Erhebung von Sprachdaten sowie deren Aufbereitung. Die zentralen 
theoretischen Axiome fundieren die funktional-pragmatische Methode in allen 
Schritten der Gewinnung wissenschaftlicher Erkenntnis. Sie kommen dabei aller- 
dings je unterschiedlich zur Geltung. 

Die Aufgabe dieses Artikels soll es sein, die systematischen Zusammenhänge 
von Methode und Theorie zu verdeutlichen. Dazu werden wir schrittweise vorge- 
hen: Beginnend mit Herausforderungen der Datenerhebung gehen wir über zu 
Fragen der Datenaufbereitung, deren Transkription und schließen mit einer Dar- 
stellung der analytischen Aufbereitung der Daten. 

Die Daten, die wir dazu heranziehen werden, sind authentische Videodaten 
aus deutsch-arabischen Mathematikfördereinheiten. Alle Daten, auf die wir in 
diesem Artikel Bezug nehmen, sind im Forschungsprojekt „MuM-Multi II: Spra- 
chenbildung im Mathematikunterricht unter Berücksichtigung der Mehrspra- 
chigkeit — Strategien mehrsprachigen Handelns in mathematischen Lehr-Lern- 
Prozessen von Bildungsinländern und Neu-Zugewanderten“* erhoben worden. 
Die anhand der Daten dargestellten forschungsmethodischen Überlegungen ba- 
sieren zudem auf den Erkenntnissen und Erfahrungen in dem Vorgängerprojekt 
„MuM-Multi: Sprachförderung im Mathematikunterricht unter Berücksichtigung 
der Mehrsprachigkeit - Wirksamkeit und Wirkungen von ein- und zweisprachi- 
gen fach- und sprachintegrierten Förderungen auf sprachliches und fachliches 
Verstehen“.° Die Daten wurden sowohl in sprachhomogenen Kleingruppen als 
auch in sprachheterogenen Regelklassen erhoben - mithin mit jeweils recht un- 
terschiedlichen Anforderungen. Wir werden uns im Wesentlichen an den Erhe- 
bungen aus MuM-Multi II orientieren, in denen Mathematikfördereinheiten mit 
neu-zugewanderten arabischsprachigen Schülerinnen und Schülern (im Folgen- 
den: SuS) in Kleingruppen von 2-4 SuS durchgeführt wurden, da sich daran die 
Anforderung der Transkription des gesprochenen Arabisch veranschaulichen 
lassen. Wir werden aber auch verschiedentlich als Vergleichsfolie die Erhebung 
in Regelklassen heranziehen, um gerade die Unterschiedlichkeit der Konstella- 


4 Das Projekt MuM-Multi II wurde von 2017-2020 vom BMBF unter der Leitung von Prof. Dr. 
Susanne Prediger (TU Dortmund) und Prof. Dr. Angelika Redder (Universität Hamburg) unter 
dem Förderkennzeichen 01JM1703A gefördert. 

5 Das Projekt MuM-Multi I wurde von 2014-2017 vom BMBF unter der Leitung von Prof. Dr. Su- 
sanne Prediger (TU Dortmund), Prof. Dr. Angelika Redder und Prof. Dr. Jochen Rehbein (Univer- 
sität Hamburg) unter dem Förderkennzeichen 01JM1403A gefördert. 
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tionen (siehe Rehbein 1977: 265) mit den jeweils unterschiedlichen Konsequen- 
zen für die Durchführung von Datenerhebungen aufzeigen zu können. 


3 Vor der Datenerhebung: Die Auseinander- 
setzung mit der Konstellation 


Bereits vor der Erhebung empirischer, authentischer Sprachdaten muss eine re- 
flektierte Auseinandersetzung mit der Konstellation, in der die Sprachdaten von 
Sprecher*innen und Hörer*innen realisiert werden, erfolgen. Dies gilt generell 
für jede Art Daten und jede Form der Datenerhebung und -analyse. 
Handlungstheoretisch gesehen ist eine Konstellation ein 


spezifisches Ensemble von Alternativen subjektiver und objektiver Art [...]. Die Konstella- 
tion, einmal eingetreten, herrscht eine gewisse Zeitlang (sie kann sehr kurz oder auch sehr 
lang sein), dann verändert sie sich (spezifisch oder total), so daß zuvor mögliche Handlun- 


gen nicht mehr möglich sind [...]. Eine Konstellation enthält also ein bestimmtes Hand- 
lungspotential, das ausgeschöpft werden kann oder auch nicht (Rehbein 1977: 265; Herv. 
im Orig.). 


Eine Konstellation besteht zum einen aus situativen Momenten der Wirklichkeit 
in die das sprachliche Handeln eingebettet ist. Dies betrifft z.B. die räumliche und 
zeitliche Situierung, die institutionelle Strukturierung des Handlungsraumes so- 
wie die beteiligten Sprecher*innen und Hörer*innen und ihre je spezifischen in- 
stitutionellen Rollen. Sie besteht aber daneben auch aus den mentalen Konfigu- 
rationen der beteiligten Aktant*innen, d.h. ihrem Wissen, ihren Einschätzungen, 
Bewertungen etc. 

Handelnde bilden ihre sprachlichen Bedürfnisse anhand der Konstellation 
aus; die Konstellation bildet den Ansatzpunkt für ihr sprachliches Handeln. 
Durch eine Auseinandersetzung mit der Konstellation können also aufseiten der 
Analytiker*innen konkrete Erwartungen an die zu erhebenden Daten ausgebildet 
werden. Dies betrifft z.B. die Frage in welchem institutionellen Verhältnis die 
Handelnden zueinander stehen, welche mentalen Voraussetzungen der Beteilig- 
ten die Konstellation strukturieren, welche Bedürfnisse die Beteiligten aller 
Wahrscheinlichkeit nach ausbilden und schließlich welche sprachlichen Hand- 
lungen oder sprachliche Handlungsmuster für deren Bearbeitung funktional und 
insofern erwartbar sind. 

Die Auseinandersetzung besteht z.B. in einer Konsultation der thematisch re- 
levanten Forschungsliteratur, in einem Austausch mit den beteiligten Personen 
in Vorgesprächen sowie in einer Besichtigung der aufzunehmenden Räumlich- 
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keiten. Kurz: Die Frage des Feldzugangs generell® ist zu klären und eine erste Be- 
gehung des Feldes ist vorzunehmen. 

Die Einschätzung der Konstellation und die darauf aufbauende Ausbildung 
von Erwartungen erfolgt vor dem Hintergrund der je leitenden Forschungsfragen. 
Sie dient der Entwicklung erster Hypothesen. Selbstverständlich kann jedoch 
selbst eine gründliche Reflektion der Konstellation nur grobe Erwartungen aus- 
bilden und kann keine konkreten Verläufe oder gar unerwartete Besonderheiten 
vorhersagen. Es muss also stets die Möglichkeit zu Modifikationen und Anpas- 
sungen der ausgebildeten Hypothesen bedingt durch situative Begebenheiten 
eingeräumt werden. Diese können dann in späteren, der Erhebung nachfolgen- 
den Phasen zur Überarbeitung und Spezifizierung der Forschungshypothesen 
dienen. 

Allerdings ist eine erste grobe Einschätzung der Konstellation im Forschungs- 
prozess insofern unerlässlich, als dass sich an ihr das Vorgehen während der Da- 
tenerhebung orientiert. 


4 Datenerhebung: Videographie von 
Unterrichtskommunikation 


Eine Datenerhebung zu realisieren erfordert also eine gute Vorbereitung. Auch 
wenn klar sein muss, dass es keinen Leitfaden geben kann, der auf jede Datener- 
hebung anwendbar ist, so gibt es doch gerade bei der Erhebung von Unterrichts- 
kommunikation ein paar allgemeine Aspekte.’ Neben der allgemeinen Auseinan- 
dersetzung mit der Konstellation (s.o.) ist bereits die Datenerhebung auf die 
Gesichtspunkte zuzuschneiden, unter denen die Daten später betrachtet werden 
sollen. Weiter: Die Entscheidung, bestimmte Formen der Datenerhebung nicht 
anzuwenden, macht diese später nicht mehr oder nur eingeschränkt rekonstru- 
ierbar - umgekehrt führt eine Überfrachtung von zu vielen Erhebungsmethoden 
ggf. zur Unübersichtlichkeit der erhobenen Daten oder zur Chaotisierung der Da- 
tenerhebung selber. Die Entscheidung über die konkrete Form der Datenerhe- 


6 Wir sparen die Frage des Feldzugangs in diesem Beitrag aus. Wir möchten allerdings nicht 
verschweigen, dass der Feldzugang in der Erforschung von Unterrichtskommunikation eine ge- 
sonderte Herausforderung ist, die in jedem Bundesland anders geregelt ist. Unter Umständen 
sind etwa gesonderte Anträge zu stellen, bevor überhaupt ein Kontakt zu einer Schule aufge- 
nommen werden darf. 

7 Den ganzen Bereich der rechtlichen Erfordernisse einer Datenerhebung von gesprochener 
Sprache sparen wir hier aus, siehe dazu etwa Schmidt et al. (2013) oder DFG (2015). 
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bung ist vorrangig von den vorab gebildeten Erwartungen sowie der jeweiligen 
Fragestellung abhängig. Die Daten müssen in der Lage sein, das sprachliche Ge- 
schehen möglichst authentisch abzubilden, und geeignet sein, die Fragestellung 
zu bearbeiten. Daneben sind sie aber zudem von den jeweiligen Besonderheiten 
des Feldes abhängig. Letztlich muss eine Entscheidung getroffen werden, die mit 
dem jeweiligen Feldzugang sowie der zugrunde gelegten Fragestellung vereinbar 
ist. Es wäre somit am Beispiel der Erhebung von Unterrichtskommunikation im 
Vorfeld mit den Entscheidungsträger*innen zu klären, welche Methoden ggf. 
nicht möglich wären. 

Der Ausdruck „Datenerhebung“ steht stellvertretend für eine Vielzahl von 
Methoden. Jedoch wird die Frage, was darunter konkret zu verstehen ist, in ver- 
schiedene Forschungsdisziplinen höchst unterschiedlich beantwortet, ja muss 
sogar zwingend unterschiedlich beantwortet werden, wie aus der Abgrenzung 
der Forschungsdisziplinen eo ipso hervorgeht. Diese Diversität ist bekanntlich 
auch innerdisziplinär vorhanden. Mitunter weicht die Vorstellung davon, was in 
der Linguistik als legitime ‚Daten‘ zu betrachten ist, stark voneinander ab.’ Nach 
der hier vertretenen Auffassung sind unter Daten oder sprachlichen Daten vor- 
rangig Aufzeichnungen authentischen sprachlichen Geschehens von Akteuren in 
authentischen Konstellationen zu verstehen. Für die Erhebung solcher Daten hat 
sich seit den 1970er Jahren die Videographie als geeignet erwiesen (s. etwa bereits 
Ehlich & Rehbein 1977) - eine Methode also, die, obwohl sie etabliert ist, dennoch 
unserer Ansicht nach hinsichtlich ihrer Durchführung bezogen auf den aktuellen 
Stand darzustellen und zu erläutern ist. War es zu früheren Zeiten noch ver- 
gleichsweise aufwändig, gesprochene Sprache technisch zu dokumentieren, 
sind die Möglichkeiten heute vielfältig und vergleichsweise einfach. Bergmann 
(1985) stellt u.a. heraus, dass die audiovisuelle Verdauerung von Interaktionen 
mit analogen Geräten und Methoden weitreichende Implikationen für die Theo- 
rie- und Methodologieentwicklungen hatte und hat. Der eklatante Unterschied 
zu den 1960ern ist aber, dass heute fast jeder Mensch in der westlichen Welt ein 
Gerät zur Aufzeichnung von Ton- und Videoaufnahmen in der Tasche trägt. Zu- 
dem ist das Audio- und Videoequipment im Vergleich zu den 1960ern nicht nur 
günstiger, die Möglichkeiten der Datenarchivierung und -aufbereitung sind viel- 
fältiger und weitaus weniger aufwändig geworden.’ 


8 Mitunter erschöpfen sich linguistische Arbeiten z.B. in statistischen Analysen oder Befragun- 
gen, ohne Sprachdaten einzubeziehen. 

9 Siehe etwa Ehlich & Rehbein (1982), die in kleinstteiliger Arbeit analog erhobene Videobilder 
und händisch geschnittene Screenshots hinsichtlich der Augenkommunikation untersuchten — 
der dafür damals notwendige Arbeitsaufwand ist heute nur noch schwer nachvollziehbar. 
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Gegenüber Audiodaten erlauben Videodaten eine detailliertere Abbildung 
der medialen Komplexität des sprachlichen Handelns unter Interaktant*innen 
im Raum. Sie erfordern allerdings eine genauere Art der Planung und Vorberei- 
tung und können zu einer Vielzahl von (neuen) Herausforderungen führen, ins- 
besondere wenn man sich mit Videodaten von mehrsprachigen Sprecher*innen 
befasst. In einigen Konstellationen können Videokameras allerdings dazu füh- 
ren, dass die Interaktion ungünstig beeinflusst wird. Das muss nicht in Form des 
sog. ‚Beobachter-Paradoxons‘ (Labov 1972: 209) sein, kann aber Vorformen da- 
von einnehmen, wenn etwa bei Lehrer*in-Schüler*in-Interaktionen Einzelge- 
spräche mit dem Zweck der Disziplinierung geführt werden. Dennoch: Ein Ver- 
zicht auf Videodaten bedeutet dem ungeachtet immer ein Verzicht auf essentielle 
Bestandteile von Interaktion." 

Im Falle von Videographien ist die Anzahl und die Positionierung der Kame- 
ras von großer Relevanz, also: Wie viele Kameras werden benötigt? Wo werden 
die Kameras positioniert? Diese Fragen sind selbstverständlich stark von der je- 
weiligen Räumlichkeit abhängig, aber entscheidend auch von den vorab ausge- 
bildeten Erwartungen und Fragestellungen an das sprachliche Geschehen in der 
Konstellation, d.h. die sprachlichen Handlungen und Handlungsmuster, die 
wahrscheinlich realisiert werden und der damit zusammenhängenden Form der 
Interaktion von Sprecher*innen und Hörer*innen. 

Eine höchst komplexe Anforderung stellt etwa die Erhebung von Unterrichts- 
kommunikation im Klassenzimmer dar, da sie eine große Zahl an Sprecher*innen 
erwartbar macht. Die Erhebung sollte daher so geplant werden, dass das Klassen- 
zimmer möglichst komplett aufgezeichnet werden kann, also möglichst keine 
Ecke und keine Schülerin unerfasst bleibt. Gleichzeitig sollte aber die Bewegung 
im Raum für die SuS und die Lehrkraft möglichst wenig eingeschränkt sein. Um 
dies zu gewährleisten kann es sinnvoll sein, Kameras mit Weitwinkel zu nutzen, 
wie in dem in Abb. 1 dargestellten Fall bei zwei Kameras. Zudem sollten auch 
Stative genutzt werden, auf denen die Kameras in einiger Höhe angebracht wer- 
den können, um das Geschehen aus der Totalen erfassen zu können, wie sich 
mitunter bei der Transkription als hilfreich erweist. Ferner ist gesondert die Lehr- 
kraft (oder sind die Lehrkräfte) zu fokussieren sowie die genutzten supportiven 
Medien - idealerweise ist auch die Sukzession eines etwaigen Tafelanschriebs 


10 Denkbar wäre selbstverständlich auch eine Nutzung von Eye-Tracking worauf wir hier je- 
doch nicht eingehen, da dadurch weitere Herausforderungen entstehen, wenngleich aber ge- 
rade im Rezeptionsprozess hochinteressante Daten gewonnen werden könnten (siehe hierzu 
etwa Bucher & Schumacher 2012). Es sei aber auch explizit darauf hingewiesen, dass eine Eye- 
Tracking-Studie in Kleingruppen eher durchführbar wäre als mit einer kompletten Klasse. 
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(0.ä.) zu erfassen (siehe Krause 2019), wenn möglich mit einer gesonderten Ka- 
mera. Alle Kameras sollten nach Möglichkeit mit externen Mikrofonen ausgestat- 
tet werden, um schlechte interne Mikrofone der Kameras auszugleichen." In un- 
serem konkreten Beispiel ergab sich folgende Positionierung für die Unterrichts- 
diskurse: 
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Abbildung 1: Positionierung von Kameras bei der Aufnahme im Klassenraum 


Zusatzlich zu den abgebildeten Kameras wurde eine Handkamera eingesetzt. Bis 
auf eine Kamera wurden alle Kameras mit Akku betrieben, um so bei Umstellun- 


11 Es sei angemerkt, dass die Möglichkeit ein externes Mikrofon an eine Kamera anzuschließen 
einer von vielen Gründen für oder gegen den Kauf eines bestimmten Kameramodells sein sollte. 
Die Positionierungen der Richtmikrofone sind hier nicht grafisch abgebildet. 
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gen der Tische, etwa bei Gruppenarbeit, flexibel reagieren zu können. Die in Ab- 
bildung 1 dargestellte Positionierung erlaubte es, das ganze Klassenzimmer lü- 
ckenlos zu erfassen, wenn auch an einigen Stellen detaillierter als an anderen. 
Dies war zum Teil der Aufstellung der Tische geschuldet, zum anderen hätten 
weitere Kameras einen größeren Eingriff in den Unterrichtsalltag in Form von 
Sichteinschränkungen der SuS oder gar Bewegungseinschränkungen bedeutet. 
Denn in keinem Fall sollte für die Aufnahmen in dieser Konstellation durch die 
Aufnahmeleitung der gewohnte Aufbau des Klassenzimmers verändert werden - 
wenn dies planmäßig durch die Lehrkraft geschieht, sähe dies freilich anders 
aus. 

In anderen Konstellationen stellt sich die Positionierung von Kameras anders 
dar, wie anhand des Aufbaus für die sprachhomogenen Kleingruppen in Abbil- 
dung 2 deutlich wird: 


GS Kamera mit Weitwinkelobjektiv 


Ed Kamera mit Normalwinkelobjektiv 


= Richtmikrofon 


Abbildung 2: Positionierung von Kameras bei der Aufnahme 
einer sprachhomogener Kleingruppe 
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Aufgrund des gut kontrollierbaren Settings und der Tatsache, dass vor allem das 
Handeln der SuS im Fokus stand, wurde hier ‚nur‘ mit drei Kameras gearbeitet, 
eine davon mit Weitwinkelobjektiv, wodurch auch Mitschreibehandlungen so- 
wie nonverbale Handlungen aller SuS zu einem gewissen Grad nachvollziehbar 
sind. ‚Nonverbales‘ (wir beziehen uns diesbezüglich auf Ehlich 2013) ist insofern 
in diesem Setting nur eingeschränkt rekonstruierbar, danonverbale Handlungen 
so heterogene Phänomene wie Mimik, Gestik und Zeigehandlungen (u.a.) begriff- 
lich zusammenfassen. Für eine Rekonstruktion der Bedeutungskonstituierung 
durch sehr ‚kleinteilige‘ nonverbale Handlungen wie Augenkommunikation (Eh- 
lich & Rehbein 1982) ist das Aufnahmesetting nicht angelegt. Damit ist das Non- 
verbalitätsverständnis, das wir für die vorliegende Arbeit anlegen, unter der Prä- 
misse einer primär sprachzentrierten Rekonstruktion zu verstehen, von der aus 
nonverbalen Handlungen nicht das hauptsächliche Erkenntnissinteresse sind. 
Das wiederum bedeutet nicht, dass nonverbale Handlungen ausschließlich kon- 
komitant, sondern auch unabhängig von gesprochener Sprache sind (siehe Eh- 
lich 2013, 652). Von besonderem Interesse für die Analyse von Unterrichtskom- 
munikation sind etwa die Direktionalität von Interaktion (etwa in Kleingruppen- 
arbeit unter den SuS), der Koordinierung von Mitschriften oder Tafelanschrieben 
sowie affirmierendes Kopfnicken als nonverbale Bewertungshandlung der Lehr- 
kraft, etc. 

Zusätzlich zu der Erhebung von Videodaten ist es sinnvoll, mit weiteren Ge- 
räten eine oder mehrere Audioaufnahmen zu erstellen, insbesondere dann, wenn 
keine externen Mikrofone genutzt werden können. Im Extremfall kann allen In- 
teraktanten ein eigenes Mikrofon zugeordnet werden - dies ermöglicht es später, 
alle Äußerungen der SuS analysieren zu können. Ein Beispiel hierfür ist z.B. das 
LIVIS-Korpus (Duarte, Gogolin & Siemon 2013). Der Nachteil eines solchen Vor- 
gehens können die entstehenden Datenmengen sein, die es aufzubereiten, zu a- 
lignieren und zu managen gilt. 

Begleitend zu den Videoaufnahmen sollten Protokollbögen angefertigt wer- 
den, im Falle der Erhebung mehrsprachiger Daten ggf. von Personen mit entspre- 
chender sprachlicher Expertise. So können bereits während der Aufnahme neben 
der Protokollierung des Ablaufes des aufgenommenen Unterrichts auch potenzi- 
ell für die Analyse relevante Passagen notiert werden. 

Solche Protokollbögen oder Beobachtungsbögen sind notwendigerweise Teil 
jeder linguistischen Videographie, in keinem Fall können sie diese jedoch erset- 
zen: Das Protokoll als Textart verdauert die mentalen Prozesse der Verfasser*in, 


12 Vgl. auch Kraft & Meng (2009) zu methodischen Mängeln von Protokolldaten für gesprächs- 
analytische Studien. 
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die dieser ggf. für andere Rezipient*innen aufbereitet. Moll (2001) bezeichnet 
Protokolle als Sekundärtextart, als „Textart zur Wiedergabe eines Diskurses“ 
(Moll 2001: 46). In dieser Wiedergabe liegt aber eben eine mentale Bearbeitung, 
die es nicht erlaubt, darauf eine linguistische Analyse von etwas anderem als der 
mentalen Bearbeitung durchzuführen. Eine Analyse der protokollierten Dis- 
kurse” selbst ist anhand des Protokolls nicht möglich. Bezogen auf Unterrichts- 
kommunikation bedeutet das, dass mit einem Protokoll oder einem Beobach- 
tungsbogen lediglich eine Schilderung der höchst subjektiven Eindrücke des 
Protokollierenden sowie eine Wiedergabe von dessen Einschätzungen der Ver- 
stehens- und Vermittlungsprozesse festgehalten werden. Dass dies keinesfalls 
Erkenntnisse über etwas anderes als besagte subjektive Eindrücke, Einschätzun- 
gen und Vermutungen liefern kann, dürfte unumstritten sein, sofern es um die 
Gewinnung linguistischer Erkenntnisse durch die mikroanalytische Betrachtung 
der Diskurse geht.“ 

Zu allen Aufnahmen sollten Metadaten über alle aufgenommenen Personen 
erhoben werden. In unserem Fall wurde das in unterschiedlicher Weise getan: Es 
wurden ein Sprachtest, ein Brüche-Test sowie ein Fragebogen zur Erhebung der 
Familienhintergründe und des sozioökonomischen Status der SuS durchge- 
führt. Zusätzlich wurden sie in einem Fragebogen bzgl. ihrer Sprachnutzung im 
Alltag befragt, so dass eine Vielzahl von Metadaten vorliegt. Metadaten können 
die Analyse bestenfalls bereichern; sie können diese aber keinesfalls ersetzen. 
Hier ist einzelfallbezogen in jeder Analyse zu entscheiden, ob diese genutzt wer- 
den können und in welcher Hinsicht sie erhellend für die linguistische Analyse 
sind — oder eben nicht. 

Sind all diese angeschnittenen Fragen der Datenerhebung, die vor allem Teil 
der Vorbereitung dieser sind, zufriedenstellend beantwortet, ist der nächste 
Schritt die Durchführung der Erhebung. Im Feld muss man mit allen möglichen 
Herausforderungen rechnen, die es oftmals spontan zu bewältigen gilt. Es ist 
kaum möglich, diese im Vorhinein allesamt zu antizipieren. Man sollte jedoch 
versuchen allen technischen Unwägbarkeiten vorzubeugen, etwa durch Ersatz- 
batterien, Ersatzspeicherkarten, etc. Generell gilt: Alles was man vorhersehen 


13 „Diskurs“ wird hier funktional-pragmatisch (i.S.v. Ehlich 2005) verstanden. 

14 Dezidiert geht es uns nicht darum - trotz dieser scharf formulierten Kritik — die (natürlich 
nicht auf Protokoll- und Beobachtungsbögen zu reduzierende) Ethnographie als soziologische 
Methode infrage zu stellen, sondern eben auf deren Stellenwert als linguistische Methode der 
Erforschung von Interaktion in Unterrichtsdiskursen abzuheben. 

15 Siehe zu den einzelnen Teilen ausführlich Schüler-Meyer et al. (2019). 
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kann, ermöglicht es, in der Aufnahmesituation den Fokus auf andere Dinge zu 
legen. 


5 Datenaufbereitung 


Die Aufbereitung von Videodaten erfolgt in zwei Schritten: der technischen und 
der inhaltlichen Aufbereitung. Erstere ist weitestgehend unabhängig von metho- 
dischen oder methodologischen Erwägungen. Sie betrifft jedoch eine Reihe von 
wichtigen Punkten. Dazu zählen die Datensicherung (die gerade bei der Erhe- 
bung von großen Datenmengen eigene Fragen, wie etwa diejenige nach ausrei- 
chendem Speicherplatz und Back-up-Möglichkeiten, nach sich ziehen), die Kom- 
primierung und Konvertierung der Videodaten in Abhängigkeit der Software (die 
für die weitere Bearbeitung der Daten verwendet werden soll") sowie die Anony- 
misierung” der erhobenen Daten und deren Bezeichnungen. Darüber hinaus 
sollte bereits vor der Bearbeitung der erhobenen Daten eine Struktur angelegt 
werden, mittels derer diese gesichert und archiviert werden. Nicht selten stellen 
Verarbeitungsprogramme spezifische Anforderungen an die Strukturierung der 
Datenablage. 

Die inhaltliche Aufbereitung der erhobenen Daten beginnt mit deren Sich- 
tung. Das Ziel dabei ist die Identifikation von für die Transkription geeigneter 
Passagen, sofern nicht sowieso zunächst erst ein Rohtranskript von jeder Auf- 
nahme erstellt wird. Wurden für die Erhebung mehrere Kameras eingesetzt, kann 
es dafür sinnvoll sein, auf Basis der Sichtung der Daten eine Hauptkameraper- 
spektive zu definieren und die weiteren Kameraperspektiven bei Bedarf heranzu- 
ziehen.” Die Entscheidung für eine Hauptkameraperspektive sollte vom Erkennt- 
nisinteresse und der Aufnahmesituation abhängen. In der in Abb. 2 dargestellten 
Aufnahmesituation der sprachhomogenen Kleingruppe wurde die Kamerapers- 


16 In diesem Zusammenhang sei auf die DFG-Handreichungen zu datentechnischen Standards 
und Tools bei der Erhebung von Sprachkorpora hingewiesen (DFG 2019). 

17 Generell sind bei der Arbeit mit Videodaten viele rechtliche Herausforderungen zu beachten, 
wie sie etwa in den Handreichungen der DFG (2015) zusammengestellt sind. Diese sind ferner 
bekanntlich essentieller Bestandteil einer guten wissenschaftlichen Praxis (s. DFG 2018). 

18 In der Regel sind die Aufnahmen der verschiedenen Perspektiven im Falle einer Erhebung 
mit mehreren Kameras nicht synchron. Eine Synchronität kann aber bei der technischen Aufbe- 
reitung der Daten leicht hergestellt werden, wenn zu Beginn der Aufnahmen ein Synchronisie- 
rungssignal — wie die ‚Klappe‘ bei Filmaufnahmen - gesetzt wird (z.B. durch lautes Klatschen). 
Anhand dieses Signals können dann die Startpunkte der verschiedenen Kameraperspektiven 
durch Schneiden der Dateien ausgerichtet werden. 
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pektive gewählt, in der die SuS und die Lehrkraft am besten sichtbar sind, in der 
in Abb. 1 dargestellten Aufnahmesituation im Klassenzimmer dürfte es sich in 
Phasen des Frontalunterrichts anbieten, von einer Kameraperspektive, die die 
Lehrkraft von weit hinten fokussiert als Hauptkameraperspektive auszugehen. 
Wenn in dieser Situation im Klassenzimmer mehrere Einzeldiskurse — nicht Ne- 
bendiskurse - also etwa in Form von Gruppenarbeit vorgängig sind, steht erneut 
die Frage der Auswahl von Passagen für die Transkription an. 

Eine sorgfältige und detaillierte Aufbereitung erhobener Videodaten ist gera- 
de dann zweckmäßig, wenn große Datenmengen erhoben wurden und es nicht 
möglich ist, das gesamte Korpus zu transkribieren, wenn also selektiert werden 
muss. Ein an großen Datenmengen erprobtes Verfahren, dass Breitsprecher et al. 
(2017: 80-84) skizzieren - die erkenntnisgeleitete Phasierung von videographier- 
ten Diskursen -, ist dazu geeignet. Für Phasierungen wird die Sukzession von 
Diskursen in Form von Tabellen festgehalten, in denen zentrale, für die analyse- 
leitenden Fragen relevante Konstellationsmomente minutengenau festgehalten 
werden können. Die so gemachten Einträge stellen Annotierungen der Videoda- 
ten dar, die später im Anschluss an die Transkription (s. § 6) in diese übertragen 
werden können und so auch für eine maschinelle Auswertung in Bezug auf das 
Gesamtkorpus zur Verfügung stehen. Im frühen Stadium, d.h. vor der Transkrip- 
tion der Diskurse, stellen Phasierungen jedoch zunächst eine Form der - komple- 
mentären — Feinprotokollierung der Daten dar. 

Breitsprecher et al. stellen das Verfahren am Beispiel wissensvermittelnder 
Hochschulkommunikation vor. Die Konstellationsmomente, die hier annotiert 
wurden sind die ‚diskurspezifischen Turn-taking-Prozesse‘ (systematisch, spora- 
disch oder kein Turn-taking), die ‚Planungshoheit für den Diskursverlauf‘ (bei 
der Dozent*in, den Studierenden oder ad hoc) sowie das ‚entfaltete Vermittlungs- 
format‘ (Referieren, kooperatives Erarbeiten oder Problematisieren). 

Die Annotierungen gehen zurück auf eine vorausgehende theoretische Aus- 
einandersetzung mit dem Untersuchungsgegenstand und den Konstellationen, 
die die Daten abbilden, sowie deren Insverhältnissetzung mit dem spezifischen 
Erkenntnisinteresse. Sie sind also nicht schlicht aus den Daten selbst, basierend 
auf den während der Erhebung gemachten Erfahrungen, extrahiert, sondern ge- 
hen auf eine theoriegeleitete Hypothesenbildung bezüglich des Untersuchungs- 
gegenstandes zurück, die anhand der Datenerhebung geschärft und präzisiert 
werden kann. Sie nehmen insofern zentrale theoretische Axiome und Einheiten 
in Anspruch. So realisiert sich z.B. im dargestellten Beispiel Breitsprechers et al. 
das ‚entfaltete Vermittlungsformat‘ wahrscheinlich, dies müsste sich aber durch 
Diskursanalysen nachweisen lassen, in Form sprachlicher Handlungsmuster — 
die Insverhältnissetzung dieser Annotierung mit den Annotierungen der Turn- 
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taking-Prozesse könnte hier einen ersten Zugriff auf mögliche Musterpositionen 
erlauben. Auch die Annotierung der Planungshoheit des Diskursverlaufes nimmt 
bestimmte Vermutungen über das sprachliche Handeln speziell aber deren insti- 
tutionelle Charakteristik in Bezug auf die Positionierung der Interaktant*innen 
zueinander in Anspruch. 

Die Annotationen werden durch festgelegte Markierungen (Schattierungen 
der entsprechenden Tabellenzellen oder Eingabe von kurzen Tags in diese) in der 
Randleiste der Phasierungstabelle festgehalten. So lässt sich die Entwicklung 
und Sukzession der annotierten Konstellationsmomente überblicksartig festhal- 
ten. Durch eine darauf aufsetzende Insverhältnissetzung der Annotierungen las- 
sen sich dann in einem weiteren Schritt konstellative Umschlagmomente oder 
mögliche Realisierungen sprachlicher Handlungsmuster etc. identifizieren, die 
dann gezielt einer Transkription zugeführt werden können. Dafür werden die 
Phasierungen um eine Notation der inhaltlichen und thematischen Entwicklung 
des videographierten Diskurses erweitert; die während der Aufnahme erstellten 
Protokolle können hierbei unterstützend wirken. 

Dieses Vorgehen verbleibt allerdings letztlich auf der sprachlichen Oberfla- 
che. Es beruht häufig auf der Ausbildung von Einschätzungen und verfolgt damit 
explizit nicht das Ziel, eine Transkription obsolet zu machen. Vielmehr werden 
durch dieses Verfahren Passagen für die Transkription identifizierbar gemacht. 
Denn die festgehaltenen Einschätzungen des Diskurses können zwar später wo- 
möglich in den Daten rekonstruiert werden. Es sollte jedoch nicht das Ziel sein, 
die Daten starr fixiert hinsichtlich dieser Einschätzungen zu betrachten und mit- 
hin den Versuch anzustellen, Kategorien in den Daten aufzufinden. Stattdessen 
ist eine eher holistische Herangehensweise an die transkribierten Diskurse wei- 
terführend (s. auch Krause & Wagner 2021 und Rehbein 2001). 


6 Transkription von Diskursen 


Um die Flüchtigkeit mündlicher Sprache zu überwinden sind Transkriptionen 
das methodische Instrument der Linguistik. Wie dies systematisch angegangen 
wird, unterscheidet sich von Transkriptionssystem zu Transkriptionssystem. Je- 
des System hat, sofern begründet durch geteilte Erkenntnisinteressen von Com- 
munities, seine Daseinsberechtigung. Es stellt sich mithin die Frage, welche 
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theoretischen und gegenstandsbezogenen Vorannahmen in Transkriptionsent- 
scheidungen und -systemen enthalten sind oder mit diesen gesetzt werden.” 

Daher ist zunächst festzuhalten, dass man sich mit der Entscheidung für oder 
gegen ein bestimmtes Transkriptionssystem zugleich für einen theoretischen Zu- 
gang entscheidet. Transkriptionssysteme existieren nicht für sich, sondern sind 
stets rückgebunden an theoretische Entwicklungen, d.h. Resultat dieser. Außer- 
dem existieren mehrere Programme, die für unterschiedliche Zwecke geeignet 
sind. Während EXMARaLDA etwa den Vorteil mit sich bringt, dass die mit dem 
Partitur-Editor erarbeiteten Transkripte und Annotationen mit den anderen Pro- 
grammen des Systems, also dem Corpus-Manager (kurz: CoMa) zur Verwaltung 
von Korpora sowie dem Such- und Analysewerkzeug EXAKT mehr oder weniger 
nahtlos zusammenarbeiten, wird etwa ELAN verstärkt in der Gestenforschung 
oder der Gebärdensprachforschung genutzt (etwa Bressem 2013), da die Software 
im Bereich der Betrachtung und Annotation von Videodaten gewisse Vorteile 
bringt. Demgegenüber stehen jedoch hinsichtlich der Transkription von gespro- 
chener Sprache gewisse Nachteile, da Partiturdarstellungen wie etwa in HIAT 
(Ehlich & Rehbein 1976 und 1981), nicht unterstützt werden. Über Transkription 
an sich ist bereits vielerorts geschrieben worden (etwa Redder 2001a, Selting et 
al. 2009, Rehbein et al. 2004). Wir werden uns, den angekündigten Daten gemäß, 
hier vor allem auf die Transkription deutsch-arabischer Diskurse konzentrieren. 
Die Frage der Übersetzung mehrsprachiger Äußerungen werden wir dabei aus- 
klammern. Hierauf wurde etwa in Rehbein et al. (2004) bereits ausführlich einge- 
gangen. 

Die theoretische Rückbindung von Transkriptionskonventionen und des 
Transkriptionsvorgangs als solchem spielt insofern eine Rolle, als Transkriptio- 
nen keine ‚objektiven‘ Verschriftlichungen von Diskursen sind. Stattdessen stellt 
die Transkription dadurch, dass Transkribent*innen während der Transkription 
ihr Sprachwissen aktivieren und die Sprachdaten einer Einschätzung unterzie- 
hen, bereits einen ersten Analyseschritt dar, der Konsequenzen für die weiteren 
Analyseschritte hat. Die von der Transkribent*in getroffenen Entscheidungen be- 
ziehen sich z.B. auf die Segmentierung der mündlichen Sprachdaten in satzför- 
mige Äußerungen, die im Medium der Schriftlichkeit relevant werden. Nicht sel- 
ten kommen schon an diesem Punkt verschiedene Transkribent*innen zu unter- 
schiedlichen Entscheidungen. Dies zeitigt mindestens zwei Konsequenzen so- 
wohl an die adaptierten Konventionen als auch an die folgenden Analyseschritte. 


19 Sie für eine detaillierter kritische Auseinandersetzung mit geläufigen Transkriptionssyste- 
men Redder (2001a). 
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Die Transkriptionskonventionen können die Entscheidungen beim Transkri- 
bieren abfangen, indem Phänomene der Mündlichkeit nicht durch diakritische 
Zeichen in die Verschriftung der Äußerung selbst abgelegt werden, sondern in- 
dem sie durch eine parallele Beschreibung der Äußerungen umgesetzt werden. 
Die Partitionsschreibweise von EXMARaLDA-Transkripten stellt hierfür die Vo- 
raussetzungen bereit. 

In der Analyse selbst muss stets der Status der Transkription als Arbeitstran- 
skription aktuell gemacht werden. Die Transkriptionen müssen eine gewisse Fle- 
xibilität bewahren, sodass sie während und durch die detailliertere Analyse wei- 
teren Überarbeitungsschritten unterzogen werden können. 

In Bezug auf die weitergehende Analyse von Transkriptionen sind vor allem 
zwei Niveaus zu unterscheiden: Die heuristische Erfassung des Datums und die 
Analyse ihrer kommunikativer Tiefenstrukturen. 

Die heuristische Erfassung eines Transkripts erfolgt in zwei Schritten, der 
Sektionierung und der paraphrasierenden Ablaufbeschreibung, die die tiefen- 
strukturelle Analyse vorbereiten, auch in diesen Schritten werden theoretische 
Einheiten und Axiome auf die Daten abgebildet. 

Bei der Sektionierung des Transkripts werden aufeinanderfolgende Äuße- 
rungen eines oder mehrerer Interaktanten zu größeren Einheiten so zusammen- 
sefasst, dass die grobe Handlungsstruktur des transkribierten Diskurses durch- 
sichtig wird. Die Sektionen ergeben sich z.B. aufgrund der institutionellen 
Einbettung eines Diskurses. Typisch für Unterrichtsdiskurse sind Sektionen wie 
‚Begrüßung‘, ‚Besprechung organisatorischer Punkte‘, ‚Rekapitulation der letz- 
ten Sitzung‘, ‚plenare Einführung in einen neuen Unterrichtsgegenstand‘, ‚Auf- 
gabe stellen — Aufgabe lösen‘ oder ‚Verabschiedung‘. Das Verhältnis von Sektio- 
nen zu den Einheiten sprachlichen Handelns (Muster, Handlungen) ist komplex. 
In Sektionen können durchaus ein sprachliches Handlungsmuster oder dessen 
wiederholter Durchlauf realisiert sein, es können aber auch mehrere verschie- 
dene, mitunter sogar miteinander verschränkte Muster realisiert sein. In der Sek- 
tionierung erfolgt allerdings noch keine Identifikation der systematischen Hand- 
lungsstruktur, mithin noch keine musterbezogene Analyse, sie bereitet diese 
aber vor. 

Aufbauend auf der Sektionierung erfolgt eine paraphrasierende Ablaufbe- 
schreibung des Diskurses, durch die die lineare Abfolge des Diskurses alltags- 
sprachlich und prä-analytisch, also unter Aktivierung des Sprachwissens und der 
konkreten Erwartungen und Erfahrungen des Analysierenden aufgrund der Da- 
tenerhebung und/oder Aufbereitung, beschrieben wird. Die Beschreibung orien- 
tiert sich also einerseits an der oberflächenstrukturellen Sukzession des Diskur- 
ses sowie an der vermuteten Tiefenstruktur. Aufbauend auf der Sektionierung 
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werden nun die Beiträge der verschiedenen Diskursteilnehmer*innen gegenein- 
ander abgehoben. So können diejenigen Äußerungen oder Äußerungsteile, die 
für die Rekonstruktion der Handlungsstruktur im nachfolgenden Schritt von be- 
sonderer Relevanz sind, identifiziert werden. 


7 Transkription deutsch-arabischer Diskurse 


In deutsch-arabischen Diskursen ergeben sich mehrere spezifische Herausforde- 
rungen beim Transkribieren, die u.a. mit den Unterschieden von arabischer und 
lateinischer Schrift zu tun haben. 

Die wohl grundlegendste Herausforderung ist die unterschiedliche Schreib- 
richtung. Dass Arabisch von rechts nach links geschrieben wird, wäre im Grunde 
in EXMARaLDA kein technisches Problem, wenn die Diskurse ausschließlich ara- 
bisch wären und auch alle Annotations- und Beschreibungsspuren auf Arabisch 
bearbeitet würden, da die Schreibrichtung prinzipiell änderbar ist. Allerdings er- 
streckt sich das Oszillogramm der Audiodatei von links nach rechts, ebenso die 
Timeline, etc. Mithin müsste eine komplett arabische Version entwickelt werden. 
Diese Probleme vervielfachen sich, wenn in demselben Diskurs neben Arabisch 
auch Sprachen genutzt werden, die von links nach rechts geschrieben werden. 
Das Setzen der Synchronpunkte in Audio- und Videodatei wäre nicht mehr sinn- 
voll möglich und Äußerungen, in denen die Sprache gewechselt wird, wären 
nicht mehr nachvollziehbar, da mitten in der Äußerung die Schreibrichtung ge- 
wechselt werden müsste. 

Zudem liegt noch ein grundlegendes Phänomen der arabischen Sprache, ge- 
nauer: der gesprochenen, dialektal geprägten arabischen Sprachen, vor. Die ara- 
bische Schrift ist für die Verschriftung aller dialektalen Abweichungen vom Stan- 
dard nicht geeignet, sofern diese den Ansprüchen einer linguistischen Transkrip- 
tion genügen soll. Neben phonetischer Varianz, die - wie auch etwa im Deut- 
schen - freilich kein Widerstand ist, werden in Dialekten auch Wörter gebildet, 
die sich nicht direkt mittels arabischer Schriftzeichen wiedergeben lassen, bzw. 
wenn, dann nur mit umfangreicheren Begleiterläuterungen. Somit eignen sich 
die arabischen Schriftzeichen ausschließlich für orthographische Transkriptio- 
nen, die an einigen Stellen Angleichungen der dialektalen Prägung an den Stan- 
dard beinhalten. 

Ferner ist ein weiterer, für die Verbreitung wissenschaftlicher Erkenntnis 
nicht unerheblicher, Aspekt zu berücksichtigen: Im Vergleich zu Sprachen die 
zumindest in Teilen auf die lateinischen Schriftzeichen zugreifen, wie etwa das 
Türkische oder das Polnische, kann Arabisch ohne grundlegende Kenntnisse der 
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Schrift nicht gelesen werden. Auch mit basalen Kenntnissen des Arabischen kön- 
nen nicht alle Wörter eindeutig identifiziert werden und mithin auch ihre Aus- 
sprache nicht korrekt nachvollzogen werden. Grund dafür ist vor allem, dass 
kurze Vokale in der Standardschrift nicht notiert werden, so dass arabische Wör- 
ter im Schriftbild ausschließlich aus langen Vokalen und Konsonanten bestehen. 
Je nach Vokalisierung, deren Notation durch die Nutzung von vokalischen Hilfs- 
zeichen, den Harakät, möglich ist, können die Wörter jedoch höchst Unterschied- 
liches bedeuten. Die Harakät werden auch genutzt, um am Wortende grammati- 
sche Beziehungen zu markieren — auch dies wird etwa in Zeitungen in der Regel 
nicht gemacht, da dies für muttersprachliche Leser*innen nicht erforderlich ist. 
Eine wichtige Ausnahme hiervor ist der Koran, in dem, um jegliche Ambiguität 
zu vermeiden, alle Wörter mit Harakät notiert sind. Dadurch wird es allen Gläu- 
bigen weltweit möglich — Kenntnisse des arabischen Alphabetes vorausgesetzt — 
die Worte des Koran gleichlautend zu lesen. Dennoch: Bei Rezipient*innen von 
Transkripten deutsch-arabischer Diskurse kann dies jedoch nicht unbedingt vo- 
rausgesetzt werden, selbst mit Vokalisierung durch Harakät und entsprechender 
Erläuterung ist die arabische Schrift ein unbestreitbares Rezeptionshindernis. 

Für alle genannten Herausforderungen gibt es Lösungen: Arabischsprachige 
Anteile der Diskurse werden in Form von Transliterationen (also mit lateinischen 
Buchstaben), mit der Schreibrichtung links-rechts transkribiert, wobei sich für 
die Transliteration an den etablierten Konventionen der Deutschen Morgenlän- 
dischen Gesellschaft (kurz: DMG) für die Transliteration des geschriebenen Ara- 
bisch orientiert wird. Diese wurden zu folgendem Zweck entwickelt: „Wiedergabe 
von linguistischen Elementen aus den islamischen Literatursprachen sowie Ei- 
gennamen aus dem Bereiche dieser Sprachen in lateinischen Buchstaben in Fäl- 
len, wo deren Wiedergabe in arabischer Schrift unmöglich oder untunlich ist“ 
(Brockelmann et al. 1935: 3; Herv. im Orig.). Daraus leitet sich ein Problem für die 
Transliteration von Diskursen ab, denn für die linguistische Arbeit zu gesproche- 
ner Sprache war dieses System dezidiert nicht gedacht, so „[...] gehören nicht 
oder nur mit Einschränkung in das Geltungsbereich des Systems solche Arbeit 
vorwiegend linguistischen Inhalts, die die gesprochenen Sprachen und Dialekte 
zum Gegenstand der Behandlung haben.“ (Brockelmann et al. 1935: Herv. i. Orig.) 
Für den oben dargestellten Zweck sind mithin Modifikationen der DMG-Konven- 
tionen erforderlich. Diese Modifikationen stehen insbesondere vor der Herausfor- 
derung, unterschiedliche Realisierungen von Vokalen abbilden zu können, um 
die einzelnen Dialekte und Variationen in der gesprochenen Sprache im Tran- 
skript wiedergeben zu können. 

Zu diesem Zweck wurde in MuM-Multi II eine Transliterationstabelle erstellt 
(vgl. Krause 2018), die Vorschläge für die Transliteration von gesprochenem 
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Arabisch zusammenführt und darstellt. Diese Vorschläge sind nicht auf die 
Transliteration einzelner Dialekte beschränkt, sondern beinhalten Umsetzungen 
unterschiedlicher Realisierungsmöglichkeiten von Vokalen, selbst wenn diese 
nicht per se einem Dialekt direkt zugeordnet werden können - schließlich lassen 
sich in der gesprochenen Sprache auch zahlreiche Abweichungen von vermeint- 
lichem (gesprochenen) dialektalem Standard beobachten, die es im Transkript 
abzubilden gilt. Dadurch wird Transkribent*innen eine recht umfangreiche In- 
terpretationsleistung” ermöglicht, indem einzelfallbezogen über die jeweilige 
Realisierung im Diskurs entschieden werden kann. Das Ergebnis ist im Idealfall 
ein präziseres Transkript, das die lautliche Realisierung nicht nivelliert. 

Diese Transliterationskonventionen wurden also basierend auf folgenden 
Grundentscheidung festgelegt: Die Transkription der arabischsprachigen Anteile 
des Diskurses wird durch Transliteration in Lateinschrift realisiert und nicht in 
arabischen Schriftzeichen. Damit folgt diese der Schreibrichtung der deutsch- 
sprachigen Anteile und auch mehrsprachige Äußerungen werden ihrer Realisie- 
rung gemäß abbildbar, ebenso auch gleichzeitiges Sprechen sowie nonverbale 
Handlungen. Ein Transkript, das diese Konventionen berücksichtigt, kann folg- 
lich aussehen, wie in Abbildung 3 gezeigt. 

In diesem (in Redder et al. 2022 detailliert analysiertem) Ausschnitt wird in 
vielerlei Hinsicht deutlich, wie hilfreich die vorgeschlagene Form der Translite- 
ration ist: Die Äußerung s16 („Mal ’arb‘aw‘iSrin e ə e mal ’arb‘aw‘igrin.“) etwa 
besteht sowohl aus deutschen wie auch arabischen Anteilen. Würde man die ara- 
bischen Anteile nun aber mit arabischen Schriftzeichen transkribieren, müsste 
die Schreibrichtung in ebendieser einen Äußerung drei Mal ändern und die Um- 
setzung wäre fast unlesbar. Die Aussprache des arabischen Anteils würde zudem 
nicht der tatsächlichen mündlichen Realisierung entsprechen, die hier von der 
idealisierten hocharabischen Transliteration (die etwa „’arb‘a wa ‘iSrin“ lauten 
würde) in Teilen abweicht. Folglich würde eine solche am schriftsprachlichen 
Hocharabisch orientierte Transliteration in der Transkription eines mehrsprachi- 
gen Diskurses hinter die Präzision der deutschsprachigen Anteile zurückfallen - 
ein definitiv nicht gewollte Ungleichheit, die durch besagte Vorschläge zur 
Transliteration zumindest partiell”! behoben werden kann. 


20 Siehe zu der Frage der Interpretationsleistung auch Lanwer (2018), der herausstellt, dass 
Transkriptionsentscheidungen bereits mitunter weitreichende Konsequenzen für die Analyse 
nach sich ziehen. 

21 Partiell, weil die Transliterationstabelle als Vorschlag zu betrachten ist und, dem Vorschlags- 
charakter gemäß, offen für Weiterentwicklungen und Ergänzungen zu begreifen ist. 
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Dy 


((2,0s)) Kif ne’raha 


Wie lesen wir das? 
R 


* «+ MiSan nhal-les bser‘a. 


+++ Damit wir schnell fertig werden. 


besta‘gel. 


n 
hay? ’aw nus- 
Oder ein Halb? 


10 
* + + Wahed ‘ala tnén ’aw nus-s. 


+++ Eins über/auf zwei oder ein Halb. 


ala bedeutet „‚über" oder „‚auf”, hier: „„durch." Also: eins durch zwei 


16 
Mal ’arb‘aw‘iSrin » + + 
Mal vierundzwanzig + + + mal 

12 14 


Tna'iS. Btetla‘. 


Zwölf. Kommt raus. 


1s 

Slön tnaʻiš? 

Wie zwölf? 

Fragt Kamala. 

17 18 
mal ’arb‘aw‘isfin. * * * ’aw nus-s el ’arb‘awiSrin. + * « Geht 
vierundzwanzig. +++ Oder die Hälfte von vierundzwanzig. 
Lacht und nickt mit 


19 21 
auch. +++ Ja? Genau. 


Sie schreibt etwas auf. 
dem Kopf. 


20 
leise 


Nus-s el ’arb‘a w ‘fin. 
Die Halfte der vierundzwanzig. 
Er schreibt etwas auf. 


Abbildung 3: Transkript eines deutsch-arabischen Diskurses 


In der vorliegenden Form kann die Äußerung zudem mithilfe der Transliterati- 
onstabelle auch von Personen gelesen werden, die nicht des Arabischen mächtig 
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sind, sofern diese sich auf die Tatsache einlassen, dass es im Arabischen Buch- 
staben gibt, die im Deutschen nicht existieren, ebenso wie zwischen kurzen und 
langen Vokalen unterschieden wird — was sich in der Transliteration natürlich 
niederschlägt. 

Selbstverständlich wäre es prinzipiell möglich, dass die arabischen Schrift- 
zeichen der einzelnen Wörter, orthographisch korrigiert, in einem weiteren Ar- 
beitsschritt, der Modifikationen aller Transkriptionsevents nach sich zieht, ein- 
gefiigt werden. Fraglich ist jedoch, wie praktikabel dies wäre - angesichts der 
dargestellten Herausforderung sollte davon möglichst abgesehen werden, insbe- 
sondere dann, wenn man es nicht mit präzisem Hocharabisch zu tun hat, was 
eher in einem Sprachlabor nicht aber in der Welt außerhalb davon zu erwarten 
ist. Wenn ein Erkenntnisinteresse an gesprochener Sprache besteht, ist von die- 
sem Vorgehen abzusehen - ist man jedoch ausschließlich am propositionalen 
Gehalt interessiert, mag dies eine akzeptable Lösung sein, die dann aber auch auf 
die deutschsprachigen Anteile anzuwenden ist, dergestalt, dass diese in selbiger 
Art orthographisch korrigiert werden. Für linguistische Interessen an der Erfor- 
schung von gesprochenen Diskursen in allen Dimensionen ist dies allerdings 
keine akzeptable Lösung. 

Man kann darüber hinaus an diesem Beispiel sehen, dass die Transkription 
der Videodaten nur sporadisch genutzt wurde. In den Partiturflächen 4 und 5 ist 
gar ausschließlich Verbales transkribiert, in den Partiturflächen 7 und 8 sind hin- 
gegen sowohl Kopfnicken als auch Aufschreibehandlungen der SuS vermerkt. In 
Partiturfläche 6 ist die Direktionalität der Interaktion unter den SuS, konkret zwi- 
schen Latif und Kamala halbinterpretativ bestimmt worden, indem in der Kom- 
mentarspur „Fragt Kamala“ vermerkt wurde. Diesem geht beim Transkribieren 
die Betrachtung des Videos voraus, aus der ebendies ersichtlich wird. Natürlich 
wäre es prinzipiell möglich, gerade an dieser Stelle noch detaillierter die nonver- 
balen Handlungen aller Interaktant*innen zu transkribieren und insbesondere 
die von Latif. Ein Transkriptionssystem wie HIAT lässt dies auch zu, der Status 
der Transkription als Arbeitstranskript wird daran sichtbar. Allerdings war die 
nonverbale Realisierung von interaktioneller Direktionalität nicht Teil der Frage- 
stellung. 

Das wiederum führt zu der Einsicht, wie stark die Fragestellung die Tran- 
skription lenken und beeinflussen kann, nicht zuletzt hinsichtlich der Granulari- 
tät der Transkription nonverbaler Handlungen. Das hat nicht zuletzt auch zeit- 
ökonomische Gründe: Gehen wir bei einer Transkription mit wenigen Sprechern 
ohne Video von einem Arbeitsaufwand von etwa 30-60 Minuten für eine Minute 
Interaktion aus, vervielfacht sich dies sowohl bei mehrsprachigen Interaktionen 
und bei der Transkription nonverbaler Handlungen. Mithin ist gerade bei Video- 
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daten aus der Fülle der zur Verfügung stehenden Daten auszuwählen und zu ent- 
scheiden, worauf sich eine Transkription im ersten Zugang konzentrieren soll. 
Dies wird bei Interaktionen in denen gesprochene Sprache zentral ist, zwangs- 
läufig zunächst Sprache sein. Darauf aufbauen lassen sich weitergehende Präzi- 
sierungen der Fragestellungen vornehmen und gezielt etwa nonverbale Hand- 
lungen präzise transkribieren. 


8 Schlussbemerkungen 


Festzuhalten ist abschließend, dass eine Analyse ohne theoretischen Bezug fak- 
tisch ins Leere läuft, ebenso wie eine methodologische Überlegung ohne Bezug 
zu einer Theorie punktlos ist. Genauer: Ohne einen Begriff von Sprache kann 
keine Sprachanalyse betrieben werden. Umgekehrt gilt: Theorien begründen Me- 
thoden und Methodologien, diese gilt es aber empirisch zu erproben und zu wen- 
den. Die in diesem Beitrag dargestellten methodischen Herangehensweisen sind 
allesamt theoretisch begründet und empirisch erprobt. Das bedeutet jedoch 
nicht, dass sie pauschal gelten, vielmehr sind sie rekursiv zu begreifen, da immer 
eingeräumt wird und eingeräumt werden muss, dass Theorien und Methoden 
durch die Konfrontation mit konsequenter Empirie modifiziert, ergänzt oder wei- 
terentwickelt werden. Gleichzeitig sollte eine auf einem bestimmten theoreti- 
schen Rahmen fußende Methode nicht exklusiv sein, sondern aus der Perspek- 
tive anderer Theorien kritisch hinterfragt und ggf. übernommen oder entspre- 
chend den theoretischen Annahmen modifiziert werden. 

Das funktional-pragmatische Verfahren ist eng verbunden mit der Notwen- 
digkeit, Sprache und sprachliche Phänomene dort aufzuspüren, wo sie sich er- 
eignen: im Feld. Wie sich allerdings dieses Feld darstellt und welche linguisti- 
schen Gegenstände sich daraus ergeben, ist nicht auf die ausschließliche Befas- 
sung mit Interaktionen bzw. Diskursen reduziert. Denn gleichzeitig, dieser As- 
pekt wurde in diesem Beitrag freilich nicht bearbeitet, sind auch Texte Gegen- 
stand der Funktionalen Pragmatik. Dies bedeutet methodisch, dass sich nicht nur 
die in diesem Beitrag dargestellten methodischen Herausforderungen für die Er- 
hebung und Transkription von Videodaten ergeben, sondern auch die Erhebung, 
Aufbereitung und Analyse von Texten entsprechend aufzuarbeiten wäre. Doch 
bereits diein diesem Beitrag thematisierten Herausforderungen bei der Erhebung 
und Bearbeitung von mehrsprachigen Videodaten werfen zahlreiche metho- 
dische Fragen auf. Von Vorteil ist in methodischer Hinsicht, dass die Funktionale 
Pragmatik auf eine lange Tradition der Betrachtung von nonverbalen Handlun- 
gen in Relation zu gesprochener Sprache zurückgreifen kann. Folglich ist eine 
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Konsequenz, dass bestehende Methodiken ggf. lediglich aktualisiert und nicht 
vollständig neuentwickelt werden müssen, wenn das Erkenntnisinteresse auf 
‚multimodalen‘ Phänomenen von Interaktion liegt. 

Ein methodischer ‚blinder Fleck‘ innerhalb der Funktionalen Pragmatik liegt 
aktuell in dem Verhältnis zu stets quantitativen korpuslinguistischen Herange- 
hensweisen, konkret vor allem zur Frage, wie mit großen Datensammlungen um- 
gegangen wird und wie aus solchen großen Datensammlungen Kategorien re- 
konstruierbar und systematisierbar sind. Mit Sicherheit ist etwa ein automati- 
sches Tagging von Illokutionen in Diskursen nicht in naher Zukunft realisierbar. 
Eine Form-Funktions-Zuordnung von einzelnen sprachlichen Elementen zu Illo- 
kutionen oder gar zu Handlungsmustern ist schlichtweg nicht möglich. Eine An- 
nahme einer solchen Möglichkeit würde die auf Austin zurückgehende Differen- 
zierung von Äußerungsakt, propositionalem Akt und illokutiven Akt verkehren. 
Wie (und ob) diese Problematik anzugehen ist und wie sich diese durch mehr- 
sprachige Videodaten potenziert, wird — neben anderen - in den nächsten Jahren 
Aufgabe der funktional-pragmatischen Forschung sein müssen. 


Literatur 


Bergmann, Jörg R. (1985): Flüchtigkeit und methodische Fixierung sozialer Wirklichkeit: Auf- 
zeichnungen als Daten der interpretativen Soziologie. In: Bonß, Wolfgang/Hartmann, 
Heinz (Hg.): Entzauberte Wissenschaft: Zur Relativität und Geltung soziologischer For- 
schung (Sonderband 3 der Zeitschrift "Soziale Welt"). Göttingen: Schwarz, 299-320. 

Breitsprecher, Christoph/Di Maio, Claudia/Guckelsberger, Susanne/Pappenhagen, Ruth/Scar- 
vaglieri, Claudio (2017): Komplexes handhabbar machen: Zur Erfassung und Durchdrin- 
gung authentischer Sprachdaten. In: Krause, Arne/Lehmann, Gesa/Thielmann, 
Winfried/Trautmann, Caroline (Hg.): Form und Funktion. Tübingen: Stauffenburg, 77-92. 

Bressem, Jana (2013): Transcription systems for gestures, speech, prosody, postures, and 
gaze. In: Müller, Cornelia/Cienki, Alan/Fricke, Ellen/Ladewig, Silva H./McNeill, Da- 
vid/Teßendorf, Sedinha (Hg.): Body - Language - Communication. An International Hand- 
book on Multimodality in Human Interaction. Berlin, Boston: De Gruyter (HSK, 38.1), 
1037-1059. 

Brockelmann, Carl/Fischer, August/Heffening, Wilhelm/Taeschner, Franz (1935): Die Translite- 
ration der arabischen Schrift in ihrer Anwendung auf die Hauptliteratursprachen der isla- 
mischen Welt. Leipzig: F.A. Brockhaus. 

Bubenhofer, Noah (2018): Wenn „Linguistik“ in „Korpuslinguistik“ bedeutungslos wird. Vier 
Thesen zur Zukunft der Korpuslinguistik. In: Osnabrücker Beiträge zur Sprachtheorie 92, 
17-29. 

Bucher, Hans-Jürgen/Schumacher, Peter (Hg.) (2012): Interaktionale Rezeptionsforschung: 
Theorie und Methode der Blickaufzeichnung. Wiesbaden: Springer. 

Bühler, Karl (1934): Sprachtheorie. Die Darstellungsfunktion der Sprache. Jena: Fischer. 


Transkription mehrsprachiger Videodaten: Von der Erhebung bis zur Analyse — 41 


DFG (2015): Handreichung: Informationen zu rechtlichen Aspekten bei der Handhabung von 
Sprachkorpora. Online: https://www.dfg.de/download/pdf/foerderung/grundla- 
gen_dfg_foerderung/informationen_fachwissenschaften/geisteswissenschaften/stan- 
dards_recht.pdf 

DFG (2018): Verfahrensleitfaden zur guten wissenschaftlichen Praxis. Bonn. Online: 
https: //www.dfg.de/download/pdf/foerderung/rechtliche_rahmenbedingun- 
gen/gute_wissenschaftliche_praxis/verfahrensleitfaden_gwp.pdf 

DFG (2019): Empfehlungen zu datentechnischen Standards und Tools bei der Erhebung von 
Sprachkorpora. Bonn. Online: https: //www.dfg.de/download/pdf/foerderung/grundla- 
gen_dfg_foerderung/informationen_fachwissenschaften/geisteswissenschaften/stan- 
dards_sprachkorpora.pdf 

Duarte, Joana/Gogolin, Ingrid/Siemon, Jens (2013): Mehrsprachigkeit im Fachunterricht am 
Übergang in die Sekundarstufe II - erste Ergebnisse einer Pilotstudie. In: Osnabrücker 
Beiträge zur Sprachtheorie 83, 79-94. 

Ehlich, Konrad (1979): Verwendungen der Deixis beim sprachlichen Handeln. Linguistisch-phi- 
lologische Untersuchungen zum hebräischen deiktischen System. Frankfurt a.M.: Lang. 

Ehlich, Konrad (1999): Funktionale Pragmatik - Terme, Themen und Methoden. In: Deutschun- 
terricht in Japan 4, 4-24. 

Ehlich, Konrad (2005): Diskurs. In: Glück, Helmut (Hg.): Metzler Lexikon Sprache. Stuttgart: 
Metzler, 148-149. 

Ehlich, Konrad (2007): Die Lust des Linguisten am Spiel - Saussure. In: Konrad, Ehlich: Spra- 
che und Sprachliches Handeln. Band 1: Pragmatik und Sprachtheorie. Berlin: De Gruyter, 
353-377. 

Ehlich, Konrad (2013): Nonverbal communication in a functional pragmatic perspective. In: 
Müller, Cornelia/Cienki, Alan/Fricke, Ellen/Ladewig, Silva H./McNeill, David/Teßendorf, 
Sedinha (Hg.): Body - Language - Communication. An International Handbook on Multi- 
modality in Human Interaction. Berlin, Boston: De Gruyter (HSK, 38.1), 648-658. 

Ehlich, Konrad/Rehbein, Jochen (1976): Halbinterpretative Arbeitstranskriptionen (HIAT). In: 
Linguistische Berichte 45, 21-41. 

Ehlich, Konrad/Rehbein, Jochen (1977): Wissen, kommunikatives Handeln und die Schule. In: 
Goeppert, Herma C. (Hg.): Sprachverhalten im Unterricht. München: Fink, 36-114. 

Ehlich, Konrad/Rehbein, Jochen (1979): Sprachliche Handlungsmuster. In: Soeffner, Hans- 
Georg (Hg.): Interpretative Verfahren in den Sozial und Textwissenschaften. Stuttgart: 
Metzler, 243-274. 

Ehlich, Konrad/Rehbein, Jochen (1981): Die Wiedergabe intonatorischer, nonverbaler und akti- 
onaler Phänomene im Verfahren HIAT. In: Lange-Seidl, Annemarie (Hg.): Zeichenkonstitu- 
tion. Akten des 2. Semiotischen Kolloquiums, Regensburg 1978, Band 2. Berlin: De Gruy- 
ter, 174-186. 

Ehlich, Konrad/Rehbein, Jochen (1982): Augenkommunikation. Methodenreflexion und Bei- 
spielanalyse. Amsterdam: John Benjamins. 

Ehlich, Konrad/Rehbein, Jochen (1986): Muster und Institution. Untersuchungen zur schuli- 
schen Kommunikation. Tübingen: Narr. 

Flader, Dieter/von Throta, Thilo (1991): Über den geheimen Positivismus und anderen Eigen- 
tümlichkeiten der ethnomethodologischen Konversationsanalyse. In: Flader, Dieter (Hg.): 
Verbale Interaktion. Studien zur Empirie und Methodologie der Pragmatik. Stuttgart: 
Springer, 144-165. 


42 — Arne Krause, Jonas Wagner 


Hoffman, Ludger (2003): Funktionale Syntax. Prinzipien und Prozeduren. In: Hoffman, Ludger 
(Hg.): Funktionale Syntax: Die pragmatische Perspektive. Berlin: De Gruyter, 18-121. 

Imo, Wolfgang (2013): Sprache in Interaktion. Analysemethoden und Untersuchungsfelder. 
Berlin: De Gruyter. 

Kraft, Barbara/Meng, Katharina (2009): Gespräche im Kindergarten. Dokumente einer Längs- 
schnittbeobachtung in Berlin-Prenzlauer Berg 1980-1983. Mannheim: Institut für Deut- 
sche Sprache. 

Krause, Arne (2018): Transkription Deutsch-Arabischer Diskurse. Anhang: Transliterationsta- 
belle. Hamburg: MuM-Multi Arbeitspapier. Online: https://www.slm.uni-hamburg.de/ger- 
manistik/personen/krause/downloads/transliterationstabelle-deutsch-arabisch.pdf 

Krause, Arne (2019): Supportive Medien in der wissensvermittelnden Hochschulkommunika- 
tion. Analysen des Handlungszwecks von Kreidetafel, OHP, PPT und Interactive White- 
board. Frankfurt a.M.: Lang. 

Krause, Arne/Wagner, Jonas (2021): Sprachliches Handeln analysieren: Funktional-pragmati- 
sche Perspektiven auf Lernen in zweit-, fremd- und mehrsprachigen Konstellationen. In: 
Drumm, Sandra/Mainer-Murrenhoff, Mirka/Heine, Lena (Hg.): Sprachtheorien in der 
Zweit- und Fremdsprachenforschung. Eine Basis fiir empirisches Arbeiten zwischen Fach- 
und Sprachlernen. Baltmannsweiler: Schneider Verlag Hohengehren, 61-84. 

Labov, William (1972): Sociolinguistic Patterns. Philadelphia: University of Pennsylvania. 

Lanwer, Jens (2018): Was steckt in den Daten und was stecken wir hinein? Méglichkeiten und 
Grenzen der gebrauchsbasierten Rekonstruktion sprachlicher Strukturen. In: Osnabrücker 
Beiträge zur Sprachtheorie 92, 219-238. 

Moll, Melanie (2001): Das wissenschaftliche Protokoll. Vom Seminardiskurs zur Textart: empi- 
rische Rekonstruktionen und Erfordernisse für die Praxis. München: iudicium. 

Redder, Angelika (2001a): Aufbau und Gestaltung von Transkriptionssystemen. In: Brinker, 
Klaus/Antos, Gerd/Heinemann, Wolfgang/Sager, Sven F. (Hg.): Text- und Gesprächslingu- 
istik. Ein internationales Handbuch. Berlin: De Gruyter (HSK, 16.2), 1038-1059. 

Redder, Angelika (2001b): Theorie und Empirie. In: Helbig, Gerhard/Götze, Lutz/Henrici, 
Gert/Krumm, Hans-Jürgen (Hg.): Deutsch als Fremdsprache. Ein internationales Hand- 
buch. Berlin: De Gruyter (HSK, 19.1), 638-647. 

Redder, Angelika (2005): Wortarten oder sprachliche Felder, Wortartenwechsel oder Feldtrans- 
position? In: Knobloch, Clemens/Schaeder, Burkhard (Hg.): Wortarten und Grammatikali- 
sierung. Tübingen: Niemeyer, 43-66. 

Redder, Angelika (2008): Functional Pragmatics. In: Antos, Gerd/Ventola, Eija (Hg.): Interper- 
sonal Communication. Handbook of Applied Linguistics. Band 2. Berlin: De Gruyter, 133- 
178. 

Redder, Angelika (2017): Diskursanalyse - handlungstheoretisch. In: Der Deutschunterricht 6 
(2017), 21-34. 

Redder, Angelika/Celikkol, Meryem/Krause, Arne/Wagner, Jonas (2022): Sprachliches Denken 
in Bewegung. In: Hohenstein, Christiane/Hornung, Antonie (Hg.): Sprache und Sprachen 
in Institutionen und mehrsprachigen Gesellschaften. Münster: Waxmann, 153-188. 

Rehbein, Jochen (1977): Komplexes Handeln. Elemente zur Handlungstheorie der Sprache. 
Stuttgart: Metzler. 

Rehbein, Jochen (1994): Theorien - sprachwissenschaftlich betrachtet. In: Brünner, Gi- 
sela/Graefen, Gabriele (Hg.): Texte und Diskurse. Methoden und Forschungsergebnisse 
der funktionalen Pragmatik. Opladen: Westdeutscher Verlag, 25-67. 


Transkription mehrsprachiger Videodaten: Von der Erhebung bis zur Analyse —— 43 


Rehbein, Jochen (2001): Das Konzept der Diskursanalyse. In: Brinker, Klaus/Antos, Gerd/Hei- 
nemann, Wolfgang/Sager, Sven F. (Hg.): Text- und Gesprächslinguistik. Ein internationa- 
les Handbuch. Berlin: De Gruyter (HSK, 16.2), 927-945. 

Rehbein, Jochen/Schmidt, Thomas/Meyer, Bernd/Watzke, Franziska/Herkenrath, Annette 
(2004): Handbuch für das computergestützte Transkribieren nach HIAT. In: Arbeiten zur 
Mehrsprachigkeit. Series B, 56/2004. Universität Hamburg: Sonderforschungsbereich 
538. 

Schmidt, Thomas/Wörner, Kai/Hedeland, Hanna/Lehmberg, Timm (2013): Leitfaden zur Beur- 
teilung von Aufbereitungsaufwand und Nachnutzbarkeit von Korpora gesprochener Spra- 
che. Mannheim: Institut für Deutsche Sprache. 

Schmitt, Reinhold (2013): Körperlich-räumliche Aspekte der Interaktion. Tübingen: Narr. 

Schüler-Meyer, Alexander/Prediger, Susanne/Kuzu, Taha/Wessel, Lena/Redder, Angelika 
(2019). Is Formal language proficiency in the home language required to profit from a bi- 
lingual teaching intervention in Mathematics? A mixed methods study on fostering multi- 
lingual students’ conceptual understanding. In: International Journal of Science and 
Mathematics Education 17 (2), 317-339. 

Selting, Margret/Auer, Peter/Barth-Weingarten, Dagmar/Bergmann, Jörg/Bergmann, Pia/Birk- 
ner, Karin/Couper-Kuhlen, Elizabeth/Deppermann, Arnulf/Gilles, Peter/Günthner, Su- 
sanne/Hartung, Martin/Kern, Friederike/Mertzlufft, Christine/Meyer, Christian/Morek, 
Miriam/Oberzaucher, Frank/Peters, Jörg/Quasthoff, Uta/Schütte, Wilfried/Stukenbrock, 
Anja/Uhmann, Susanne (2009): Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). 
In: Gesprächsforschung - Online-Zeitschrift zur verbalen Interaktion 10 (2009), 353-402. 


Matthias Meiler 

Method(olog)ische Herausforderungen der 
Analyse sprachlichen Handelns in 
kommunikativen Praktiken 


Abstract: Der Beitrag versucht eine methodische Systematik zu skizzieren, mit 
der die Linguistik der Aspektheterogenität (Feilke 2016) ihres Gegenstands Spra- 
che wie ebenso des Phänomens sprachlichen Handelns in kommunikativen Prak- 
tiken (Habscheid 2016) Rechnung tragen kann. Den exemplarischen Ausgangs- 
punkt stellen dabei die methodischen Anforderungen der Analyse eristischen 
Handelns im Rahmen der Praktik innerwissenschaftlichen Bloggens (Meiler 
2018) dar. Dabei wird dafür plädiert, mit je unterschiedlichen Forschungsmetho- 
den sowohl die kulturellen wie auch die medialen Aspekte (Klemm/Michel 2014), 
die Sprache und sprachliches Handeln bestimmen, empirisch einzuholen, um 
eine konkrete kommunikative Praktik angemessen rekonstruieren zu können. 
Eine solchermaßen orientierte Sprachanalyse steht in der Tradition medien- und 
kulturanalytischer Linguistik und ist anschlussfähig an die sich interdisziplinär 
formierende Praxistheorie. 


Keywords: Methodologie, Medienlinguistik, Pragmatik, Praxistheorie, 
Methodenperformativität, Triangulation, kontrastive Forschung, Weblogs, 
Wissenschaftskommunikation 


1 Ausgangslage 


Der Blick in die Geschichte von Wissenschaft und ihre Kommunikationsstruktu- 
ren macht deutlich, wie konstitutiv der Zusammenhang zwischen beidem ist. Un- 
sere heutige Auffassung von dem, was der Zweck von Wissenschaft und mit wel- 
chen Verfahren dieser zu verfolgen ist, wird in seiner Entstehung nicht ohne eine 
eingehende Betrachtung frühneuzeitlicher Mediengeschichte verstehbar. Ge- 
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druckte Bücher (und später auch Zeitschriften), die zunächst wesentlich als Han- 
delsware begriffen wurden, legten den Grundstein für die normative Struktur, die 
heute als Voraussetzung für gute wissenschaftliche Praxis angesehen wird (vgl. 
Giesecke 1994; Stichweh 1984): Das Typographeum und der frühe kapitalistische 
Markt bildeten die Grundlage für ein sich entwickelndes öffentliches Kommuni- 
kationssystem mit massenmedialen Eigenschaften. Innerhalb eines solchen Sys- 
tems können Publikationen und mit ihnen neue Ideen und Einsichten leicht und 
frei zirkulieren, und sie werden nicht vor der Veröffentlichung von diversen Au- 
toritäten als gesicherte Wahrheiten ‚zugelassen‘, sondern danach im System 
selbst von den eigenen Peers dahingehend beurteilt, als wie belastbar und damit 
anschlussfähig eine unterbreitete Erkenntnis sich erweist. 

Heute sehen wir uns einer vergleichbar grundlegenden Transformation aller 
Kommunikationsstrukturen gegenüber. Für das Kommunikationssystem Wissen- 
schaft ist dies u.a. damit verbunden, dass einerseits sein ökonomisches Funda- 
ment grundlegend infrage gestellt wird, indem zunehmend open access und auch 
verlagsunabhängig publiziert wird. Die Hintergründe sind hier im Einzelnen 
mannigfaltig (vgl. bspw. Hagenhoff et al. 2007). Andererseits werden zunehmend 
Medieninfrastrukturen erschlossen, die sich von den traditionellen Publikations- 
infrastrukturen signifikant unterscheiden und für die Wissenschaft insofern neu 
sind: soziale Medien und Netzwerke. 

Freilich schlagen solche ersten Gehversuche nicht instantan in ein ‚neues‘ 
Wissenschaftssystem um, dafür müssen sie sich erst systemisch etablieren und 
nicht lediglich, wie derzeit im Falle der sog. sozialen Medien, eine sozusagen frei- 
willige Zusatzbeschäftigung darstellen. Nichtsdestotrotz binden sich an die di- 
versen Nutzungsformen genuin digitaler Kommunikationsinfrastrukturen, wie 
sie aktuell innerhalb der Wissenschaft zu beobachten sind, auch diverse wissen- 
schaftspolitische Bestrebungen - und einen Einfluss auf die Struktur von Wis- 
senschaftskommunikation und die Organisation und Distribution des wissen- 
schaftlichen Wissens haben diese Nutzungsformen ohnehin bereits. 

Die Erforschung dieser rezenten Formen interner Wissenschaftskommunika- 
tion ist also geboten und geschieht freilich schon (Gloning/Fritz 2011) - nicht nur 
in der Linguistik (Nentwich/König 2012; Neuberger 2014). Die forschungsprakti- 
sche Ausgangslage stellt sich dabei als besonders herausfordernd dar, da es um 
die Analyse von sprachlich-kommunikativen Praktiken geht, die sich im Interim 
befinden und für die sich folglich (noch) keine etablierten Lösungen für standar- 
disierte Probleme stabilisiert haben (wie man mit Blick auf die Gattungsanalyse 
sagen könnte; vgl. Stein 2011) - ja, esist nicht einmal klar, was die Standardprob- 
leme sind. 
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Diese Bilanz lässt sich bspw. für social networks wie Academia.edu oder Re- 
searchGate konstatieren, für wissenschaftliches Twittern ebenso wie für wissen- 
schaftliches Bloggen. Innerhalb dieser Infrastrukturen lässt sich zwar fast immer 
sowohl (i) das Kerngeschäft von Wissenschaft, das kommunikative Ringen um 
Erkenntnis, finden, ebenso auch (ii) Organisations- bzw. Projektkommunikation 
und (iii) Selbstdarstellung und Beziehungspflege wie auch (iv) externe Wissen- 
schaftskommunikation. Aber verbindliche kommunikative Muster, wie sie sich in 
der sog. Gutenberg galaxy für die Wissenschaft ausgebildet haben, stehen hier — 
wie für das global village wohl selbst auch - historisch betrachtet noch an einem 
Anfang (vgl. McLuhan 2011: 13 ff., 41 ff.). 


2 Herausforderungen 


Geht man von dieser Ausgangslage aus, ergeben sich für die Analyse sprachli- 
chen Handelns in solchen digitalen Kontexten unterschiedliche Herausforderun- 
gen. Soll dabei das eben genannte Kerngeschäft von Wissenschaft (i), der kom- 
munikative Umgang mit der „Vorläufigkeit und Strittigkeit wissenschaftlichen 
Wissens“ (Thielmann et al. 2014: 7), z.B. im Rahmen der Praktik innerwissen- 
schaftlichen Bloggens behandelt werden - funktional-pragmatisch gesprochen 
handelte es sich um Eristik bzw. eristisches Handeln (vgl. Meiler 2018) -, stehen 
eine Reihe unterschiedlicher methodischer Möglichkeiten zur Verfügung, solches 
sprachliches Handeln in wissenschaftlichen Weblogs vom Standpunkt der lingu- 
istischen Pragmatik aus zu erforschen. Auf diese soll hier fokussiert werden. Da 
dieses spezifische Handeln in einer konkreten Praktik der internen Wissen- 
schaftskommunikation hier als exemplarischer Ausgangspunkt dienen soll, er- 
scheint es notwendig einige Worte einzuschieben, um den Gegenstand ,Eristik‘ 
bzw. ‚eristisches Handeln‘ zu charakterisieren. 

Eristisches Handeln kann als das wesentliche Strukturkennzeichen interner 
Wissenschaftskommunikation betrachtet werden. Von Ehlich (1993) auf den Be- 
griff gebracht wird im Rahmen der Funktionalen Pragmatik unter Eristik ein me- 
dienlinguistisches und ein soziolinguistisches Bestimmungsmoment wissenschaftli- 
cher Texte erfasst. 


Wir sehen in diesen Texten also weit mehr als das einfache ‚mapping‘ von Wirklichkeit über 
mentale Verarbeitung hinein in ein Stück Sprache. Wir erleben in den sprachlichen Formen 
den Prozess der Diskussion der Wissenschaft selbst. In den Texten ist die diskursive Qualität 
des Wissenschaftsprozesses als eines Prozesses der streitenden Auseinandersetzungen ein- 
geschrieben. Mit anderen Worten: Der Wissenschaftsprozess schlägt sich in der Textstruk- 
tur in einer illokutiven Vielfalt nieder, die eine Einschränkung auf Assertionsqualität illoku- 
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tiv weder sinnvoll noch möglich macht. Vielmehr tragen die wissenschaftlichen Texte als 
ein wesentliches Strukturkennzeichen in sich ihren diskursiven Charakter, der durch die 
Textualität verfremdet worden ist. Die wissenschaftlichen Texte sind sozusagen Residuen 
und Petrefakte von diskursiven, insbesondere von eristischen Strukturen, die in den textu- 
ellen Strukturen aufgehoben sind. (Ehlich 1993: 30) 


Innerhalb einer konkreten Praxis- und Diskursgemeinschaft (der Wissenschaft- 
ler*innen) muss der entscheidende Zweck ihres Tuns (das gemeinsame Ringen 
um Erkenntnis) entsprechend der sich dafür etablierten Normen (vgl. Merton 
1973) unter den medialen Bedingungen der Textualität bearbeitet werden. Diese 
Grundkonstellation interner Wissenschaftskommunikation hat die im Zitat ange- 
sprochene illokutive Vielfalt zur Folge, die anhand der sprachlichen Form dieser 
Texte nur dann verständlich wird (vgl. Ehlich/Graefen 2001: 371), wenn eine ge- 
wisse Sozialisierung hinein in die erwähnte Gemeinschaft über die Aneignung 
ihrer Praktiken erreicht ist. Diese Aneignung umfasst im Allgemeinen das Prä- 
suppositionssystem der Praxis interner Wissenschaftskommunikation sowie e- 
benso das Musterwissen, das die allgemeinen Präsuppositionen auf die Bearbei- 
tung konkreter kommunikativer Zwecke in einzelnen (textuellen wie diskursi- 
ven) Gattungen bezieht. Exemplarisch können hier Mertons Norm des organisier- 
ten Skeptizismus sowie die davon ableitbaren Gebote Weinrichs (1986), nament- 
lich das Rezeptions- und Kritikgebot, genannt und auf jene kommunikativen 
Muster verwiesen werden, die diese in unterschiedlicher Weise bspw. in den eta- 
blierten Zeitschriftengattungen ‚Artikel‘ und ‚Rezension‘ umsetzen. Wie in Ab- 
schnitt 1 dargestellt ist die Herausbildung solcher Gattungsmuster dabei durch- 
gängig von - sensu Luginbühl (2018) - medialer Durchformung gekennzeichnet. 

Es wird an dieser Stelle bereits ersichtlich, dass bei einer solchen Perspektive 
auf sprachliches Handeln an der einen oder anderen Stelle über die Methoden 
der linguistischen Pragmatik i.e.S. hinausgegangen werden muss. Wesentliche 
Ursache dafür ist v.a. eine Grundeigenschaft des Phänomens Sprache, die Feilke 
wie folgt formuliert: 


Sprache ist ein in exemplarischer Weise aspektheterogener Gegenstand: Sie ist individuell 
wie sozial geprägt, sie ist handlungsbezogen und zugleich hochgradig handlungsfern 
strukturiert, sie ist biologisches Merkmal der Gattung Mensch und zugleich in ihrer histori- 
schen Entwicklung grundlegend von soziokulturellen Faktoren bestimmt. (Feilke 2016: 9) 


Diese Aspektheterogenität ist dabei nicht nur aus der Vogelperspektive und da- 
mit quasi lediglich metatheoretisch von Relevanz. Sie stellt sich auch in jedem 
der von Feilke angedeuteten Teilbereiche als begriffliche und methodische Her- 
ausforderung, wenngleich je anders perspektiviert. Denn die analytische Durch- 
dringung eines Teilbereiches wie bspw. der Handlungsqualität von Sprache setzt 
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in ihrem Fundament oder Horizont die jeweils anderen Bereiche gleichsam vo- 
raus: So bedürfen Handlungen zu ihrem Vollzug diverser Strukturen, d.h. gesell- 
schaftlich ausgearbeiteter Mittel; diese setzen eine gesellschaftlich abzweckbare, 
d.h. formbare, physikalische wie natürlich physiologische Materialität voraus 
(vgl. Ehlich 2007b). Feilkes Diktum kann im Übrigen vermutlich widerspruchslos 
auf alle Phänomene ausgeweitet werden, die kulturwissenschaftlich erforscht 
werden. 

Mindestens im Laufe des 20. Jahrhunderts führte diese Einsicht in die Aspekt- 
heterogenität zu verschiedenen Weiterungen des Gegenstandes Sprache: zu kog- 
nitiven, sozialen, pragmatischen, kulturellen, medialen und multimodalen Wei- 
terungen unserer Auffassung davon, was Sprache ist und wie man sie zu unter- 
suchen hat.! Deswegen kann die Analyse von Wissenschaftskommunikation 
nicht bspw. bei wissenschaftlicher Terminologie haltmachen oder bei grammati- 
schen Strukturen der Deagentivierung und Kondensation und auch nicht bei der 
Beschreibung typischer Muster diverser wissenschaftlicher Gattungen. Je stärker 
die Analyse von Wissenschaftskommunikation entweder durch die Medien- und 
Kulturgeschichte informiert wird oder die Selbstverständlichkeiten dieser Praxis 
selbst durch rezente Dynamiken der Medienentwicklung verunsichert und ver- 
fremdet werden, drängt sich die Notwendigkeit für Weiterungen im eben genann- 
ten Sinne auf: Weiterungen, die u.a. unter dem Label ‚medien- und kulturanaly- 
tische Linguistik‘ zusammengefasst werden können (vgl. Klemm/Michel 2014; 
Luginbühl 2015). 

Auch ein Gegenstand wie die Eristik, der zunächst maßgeblich auf die illoku- 
tive Dimension von Wissenschaftskommunikation abzielt (s.o.), zumal wenn Fris- 
tik in wissenschaftlichen Weblogs untersucht werden soll, muss deswegen, wie 
bereits angedeutet, den notwendigen Weiterungen unterzogen werden: metho- 
dologisch und methodisch. Sprachliches Handeln im Allgemeinen und sprachli- 
ches Handeln ‚in digitalen Kontexten‘ im Besonderen ist dabei aber wohl nur in 
geringem Umfang auf Basis von Musterlösungen, Methoden (M.) im engeren Sin- 
ne, zu analysieren: 


X ist eine M. genau dann, wenn X eine Folge von relativ scharf umrissenen Handlungen 
oder Entscheidungen ist, deren Ausführungen evtl. unter genau angegebenen Bedingun- 
gen empfohlen wird zur Realisierung relativ bestimmter vorgegebener Ziele; die Glieder von 
X werden Schritte genannt (M. im engeren Sinne), oder wenn X eine Menge mehr oder 


1 Wie Feilke (vgl. 1996: 15-32) an anderer Stelle wissenschaftsgeschichtlich zeigt, besteht die 
Gefahr darin, einzelne dieser durch Weiterungen explorierte Aspekte im Dienste der Gegen- 
standskonstitution begrifflich zu Hypostasieren. Daran schließt sich die Herausforderung einer 
integrativen Gegenstands- und Theoriebildung an (s. Abschnitt 6). 
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weniger vage charakterisierbarer Handlungen oder Handlungs- bzw. Entscheidungsdispo- 
sitionen ist, die zur Erreichung relativ unbestimmter oder bestimmter Ziele evtl. unter mehr 
oder weniger bestimmten Bedingungen empfohlen wird (M. im weiteren Sinne). (Mehrtens 
1990: 403 f.) 


Methoden im umrissenen weiteren Sinne müssen situativ flexibel sein und je fall- 
bezogen konkretisiert werden. Dennoch lassen sich m.E. einige systematische Zu- 
sammenhänge aufzeigen, um der Aspektheterogenität des Gegenstandes metho- 
disch gerecht zu werden. Dabei soll von konkreten Einzeluntersuchungen eines 
umfangreicheren Projektes (Meiler 2018) ausgegangen werden, um einige der 
dort vorgezeichneten Linien zu verlängern. Deswegen werden zunächst am Bei- 
spiel der Praktik innerwissenschaftlichen Bloggens jene Wege abgeschritten, mit 
denen im erwähnten Projekt die verschiedenen Aspekte des Phänomens als ei- 
gene Forschungsgegenstände erfasst wurden (Abschnitt 3 & 4). Davon ausge- 
hend wird versucht, die Umrisse einer Systematik der methodischen Ausleuch- 
tung wesentlicher Aspekte sprachlichen Handelns in konkreten Praktiken zu 
skizzieren (Abschnitt 5). Abschnitt 6 beschließt mit einem knappen Ausblick auf 
das, was ich eine linguistische Praxeologie zu nennen geneigt bin.? 


3 Eristisches Handeln in wissenschaftlichen 
Weblogs I: Aspekte des Gegenstandes und ihre 
methodische Einholung 


Wie kann den erwähnten Herausforderungen für die Analyse eines exemplari- 
schen Gegenstands wie dem eristischen Handeln im innerwissenschaftlichen Blog- 
gen nun konkret Rechnung getragen werden? Allein schon die Phrase, die den 
Gegenstand benennt, deutet seine Komplexität bereits an. Es geht um sprachli- 
ches Handeln, Handeln einer besonderen Art, nämlich ‚eristisches‘ (s.o.). Es geht 
um die Domäne Wissenschaft, konkret um die Kommunikation unter Peers. Diese 
findet zudem in Weblogs statt, in einer medialen Umgebung also, die für die Wis- 
senschaft noch nicht als typisch bzw. systemisch bezeichnet werden kann. 


2 Dieser Beitrag geht zurück auf einen Vortrag, der auf der Jahrestagung Digitale Pragmatik der 
Arbeitsgemeinschaft Linguistische Pragmatik 2020 in Hamburg gehalten wurde. Er versucht, 
methodologische und methodische Überlegungen systematisierend weiterzuführen, die ich im 
meinem Dissertationsprojekt (s. Meiler 2018) in vier Einzelfallstudien erprobt habe. 
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Als Linguist*in scheint es sinnvoll, den Ausgangspunkt beim sprachlichen 
Handeln zu nehmen. Handlungsqualität lässt sich bekanntlich nicht erheben 
und messen, ebenso wie Bedeutung im traditionellen Sinne sich nicht unmittel- 
bar durch Hinschauen ermitteln lässt, sondern sowohl für Akteur*innen wie für 
Analytiker*innen ein interpretatives Konstrukt ist, das sich im Kommunikations- 
und Analyseprozess Zug um Zug bewähren muss (vgl. Holly et al. 1984; Schegloff 
1992; Liedtke 1997). Der Interpretationsprozess kann sich dabei nicht nur auf die 
sprachliche Oberfläche und auf sog. grammatisches und semantisches Wissen 
verlassen, wenngleich beide die Analyse leiten müssen. Die darüber hinaus rele- 
vanten Präsuppositionssysteme (vgl. Ehlich/Rehbein 1975), die dem jeweiligen 
Kommunikations- und Interpretationsprozess zugrunde liegen, werden als sol- 
che von den Interaktant*innen fraglos vorausgesetzt und nur selten expliziert.? 
Als Erwartungsstrukturen, die durch die Praxis entwickelt und in der Praxis er- 
worben werden, leiten Präsuppositionen die Interaktant*innen durch den Ver- 
ständigungsprozess und räumen diverse Möglichkeiten seiner Bewältigung ein, 
genauso wie sie einzelne Handlungswege als unangemessen ausschließen. Sie 
werden vor allem bei Problemen thematisch. Die Interpretation sprachlichen 
Handelns muss Kenntnis von diesen Redehintergründen haben - und diese sind 
spezifisch für jede Praxisgemeinschaft und nicht immer einfach zugänglich (vgl. 
Deppermann 2013). 

Für die Analyse sprachlichen Handelns in etablierten und lang tradierten 
Gattungen der internen Wissenschaftskommunikation sind diese Präsuppositi- 
onssysteme aber verhältnismäßig leicht zu greifen. Die Geschichte ihrer Refle- 
xion und Analyse bspw. in philosophischen (vgl. Popper 1969), soziologischen 
(vgl. Merton 1973) und linguistischen Studien (vgl. Weinrich 1986, 1988; Rhein 
2015), aber auch in der Ratgeberliteratur (vgl. z.B. Oertner et al. 2014; Moll/Thiel- 
mann 2017) ist verhältnismäßig lang. Das Präsuppositionssystem interner Wis- 
senschaftskommunikation kann als gesellschaftlich objektiviert gelten (i.S.v. Ber- 
ger/Luckmann 2000) - gerade weil die Praxis interner Wissenschaftskommuni- 
kation sich in ihren medialen Infrastrukturen über lange Zeiträume hat entwi- 
ckeln, ausdifferenzieren und stabilisieren können. 


3 Vergleichbar könnte auch mit dem Begriff des common ground (vgl. z.B. Clark 1996) gearbeitet 
werden, wie dies im medienlinguistischen Kontext Dang-Anh (2019) tut. Es erscheint wichtig, 
hier darauf hinzuweisen, dass es Ehlich/Rehbein (1975) um Handlungspräsuppositionen geht, 
die für Sprecher*innen und Hörer*innen gleichermaßen als gültig/bekannt unterstellt werden, 
und nicht nur um Präsuppositionen, die sich unabhängig von den Interaktant*innen aus dem 
propositionalen Akt der Sprachhandlung ergeben. 
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Wie eingangs betont, sind solche Normen und Konventionen der Kommuni- 
kation unter Wissenschaftler*innen aber hochgradig abhängig von den medialen 
Bedingungen, unter denen sie entstehen und in Anspruch genommen werden. 
Das bedeutet gleichsam, sich die mediale Gebundenheit der bestehenden Kon- 
ventionen und Normensysteme bewusst zu machen und diese nicht - trotz ihres 
nicht zu leugnenden Fortbestehens und Fortwirkens — bruchlos für neu entste- 
hende Praktiken, wie der des innerwissenschaftlichen Bloggens, vorauszusetzen. 
Daraus ergibt sich ganz unmittelbar die methodische Herausforderung, auf wel- 
chen Wegen solche neuen, unbeschriebenen, nicht gesellschaftlich verallgemei- 
nerten und/oder schwer zugänglichen Präsuppositionen analytisch zugänglich 
gemacht werden können. Praktiken, die sich maßgeblich im WWW konstituieren, 
bergen hier ihre besonderen Herausforderungen ebenso wie sie manches metho- 
disch einfacher zugänglich erscheinen lassen (vgl. bspw. Meiler 2021b). 

Da eine Praktik wie das innerwissenschaftliche Bloggen in sich selbst aspekt- 
heterogen ist (weil sie über die sprachlichen Kennzeichen hinaus multimodal, 
mental, sozial, kulturell, korporal, technisch bestimmt ist; vgl. Rammert/Schu- 
bert 2017), müssen hier unterschiedliche Dimensionen adressiert werden, für die 
sich jeweils unterschiedliche methodische Wege der Erschließung anbieten. 

Der medienlinguistische Begriff Kommunikationsform macht eine Dimen- 
sion der Praktik, nämlich die mediale, umfänglich analytisch zugänglich (vgl. 
Holly 2011; Domke 2014; Brock/Schildhauer 2017). Weblogs können als Kommu- 
nikationsformen beschrieben werden (vgl. Meiler 2013; Schildhauer 2014). Die 
analytische Fruchtbarkeit dieses Begriffes hat sich in verschiedenen Kontexten 
erwiesen (eher kritisch dazu bspw. Luginbühl 2015). Mit ihm werden mediale Er- 
möglichungsbedingungen für Kommunikation erfasst. 

So ermöglicht bspw. die Kommunikationsform E-Mail gegenüber ihrem me- 
diengeschichtlich älteren Bruder, dem Brief, eine viel schnellere Übermittlung 
der Schrift-, Bild- und sogar akustischen Zeichen zwischen den Kommunizieren- 
den, was die kommunikativen Prozesse, die E-Mails ermöglichen, enorm be- 
schleunigt und tendenziell auch weniger textuelle und mehr diskursive Formen 
annehmen lässt (vgl. Holly 2011: 152 f.), wie man mit Rückgriff auf die Unterschei- 
dung von Ehlich (1983) sagen kann (vgl. Meiler 2020: 154). Konkrete E-Mail-Bot- 
schaften sind dabei nicht nur mit viel weniger materialem und Arbeitsaufwand 
herstellbar, sondern auch viel einfacher in identischer Gestalt an mehrere Adres- 
sat*innen versendbar,* was freilich auf den Unterschied in den fundierenden 


4 Ein schönes, geradezu anachronistisch anmutendes Relikt dieses mediengeschichtlichen Zu- 
sammenhanges stellt die Carbon-Copy-Zeile dar, die in allen E-Mail-Formularen bzw. -Program- 
men standardmäßig zu finden ist und etymologisch noch heute auf eine alte Kulturtechnik der 
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Infrastrukturen (s.u.) von E-Mail und Brief zurückzuführen ist (vgl. Holly 2011: 
152 f.). Dies prädestiniert E-Mails heute, da sie sich als ein Weg der Kontaktnahme 
gesellschaftlich beinahe vollständig durchgesetzt haben, für andere kommuni- 
kative Zwecke als Briefe (mit Überschneidungen natürlich). 

Kommunikationsformen werden mithin verstanden als historisch gewach- 
sene, mediale Präfigurationen mit bestimmten Restriktionen und Potenzialen, 
die einerseits für ganz unterschiedliche Kommunikationsanlässe in verschiede- 
nen Domänen genutzt werden können (Stichwort: Multifunktionalität; vgl. Brin- 
ker 2005) und von denen andererseits die Kommunizierenden selbst auch ein 
spezifisches (eben ein Kommunikationsformen-)Wissen haben. Dieses Wissen ist 
freilich in Abhängigkeit davon sozial distribuiert, wie stark eine Kommunikati- 
onsform im kommunikativen Haushalt einer Gesellschaft oder Gemeinschaft ver- 
ankert ist.’ 

Es hat verhältnismäßig lange gedauert, bis sich die Erkenntnis durchgesetzt 
hat, dass Weblogs (wie andere Kommunikationsformen) nicht mit Begriffen wie 
Gattung, Genre, Textsorte etc. beschrieben werden können (vgl. Miller/Shepherd 
2009). Dies kann auch als Reflex darauf verstanden werden, wie stark das gesell- 
schaftlich verbreitete (Ethno-)Wissen um einzelne Nutzungsweisen, die aufgrund 
medialer Sichtbarkeit und/oder sozialem Prestige als Stereotype in den Fokus ge- 
rückt und dann verdinglicht werden, den präzisen Blick aufeine aktuell verfügbare 
Kommunikationsform verstellen und Analysen in die Irre führen kann. 

Solche Einzelmedienontologien, wie man mit Leschke (2003) sagen kann, 
deuten sich in Annahmen von einer Webliteralität und Webrhetorik (vgl. Dieter 


Vervielfältigung verweist, die in der Kommunikationsform E-Mail ihrer ursprünglichen Materia- 
lität gänzlich enthoben ist. 

5 Dieses Kommunikationsformenwissen lässt sich vom Gattungs-/Textsortenwissen unterschei- 
den. Dass dieser Unterschied nicht nur aus Altrokategorien ableitbar ist, sondern selbst auch 
eine ethnokategoriale Wirklichkeit hat, lässt sich empirisch nachweisen (vgl. Meiler 2018: 283- 
312). 

6 Einzelmedienontologien können als simplifizierende Bewältigungsmechanismen im Umgang 
mit Medialitäten betrachtet werden, die für eine Gesellschaft, Gemeinschaft oder Gruppe jeweils 
neu sind, aber dadurch bewältigbar werden, dass ihnen ein So-und-so-Sein zugeschrieben wird. 
Sie „stellen den Versuch dar, sich der sinnlichen und technischen Provokation von jeweils 
neuen Medien durch Strategien der Sinnzuschreibung zu entledigen: Dem Medium wird ein Sinn 
verabreicht und das neue Phänomen tritt aus seiner Unberechenbarkeit heraus. [...] Dass der 
Sinn dabei gewöhnlich nur wenig über seinen Gegenstand [...] verrät und die Analyse in der Re- 
gel nur solange andauert, bis der Sinn gefunden ist, trübt die medienwissenschaftliche Bilanz 
dieser Strategien durchaus“ (Leschke 2003: 154). I.d.R. sind sie durch unzulässige Verallgemei- 
nerungen einzelner Praktiken, die eine mediale Konfiguration ermöglicht, kennzeichnet. Diese 
erscheinen dann in der jeweiligen Auffassung vom Medium verdinglicht. 
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2007) oder von Netspeak und Chat-Sprache (vgl. Crystal 2001) an. Selbiges war 
bzw. ist auch in verbreiteten Vorstellungen von Weblogs zu finden. Solche Vor- 
stellungen entwachsen nicht zuletzt den (populären) 


Selbstverständnis- und Abgrenzungsdiskursen |...], die kollektive Erwartungen und Beden- 
ken an Weblogs formulieren sowie bestimmte Verwendungsweisen legitimer oder ‚richti- 
ger‘ erscheinen lassen als andere. Sie tragen daher zu einer kollektiven Formierung von 
interpretativem Wissen bei, das als Bestandteil von Verwendungsregeln die individuellen 
Praktiken rahmt. (Schmidt 2006: 172) 


Es ist hilfreich, beide Aspekte zunächst sorgfältig auseinander zu halten. Denn 
die Analyse von Kommunikationsformen (ihren Eigenschaften, Möglichkeiten 
und Grenzen) und die Analyse von (mehr oder weniger Stereotypen-gebunde- 
nem) Kommunikationsformenwissen haben jeweils auch sehr unterschiedliche 
methodische Anforderungen. 

Die kommunikationsstrukturellen Parameter nach denen Kommunikations- 
formen wie Weblogs charakterisiert werden (wie semiologisches Potenzial, Di- 
rektionalität, Beteiligungsstruktur, Zeit- und Raumgebundenheit; s. Domke 2014 
für einen Überblick), können recht einfach in Erfahrung gebracht werden. Dafür 
ist keine allzu tiefgehende Systemanalyse notwendig. Eine solche Analyse verrät 
einem aber noch nicht viel über die kommunikativen Praktiken, die darin ihre 
Form finden können. Wie diese Praktiken innerhalb des kommunikativen Haus- 
halts einer spezifischen Domäne verortet sind (und warum das der Fall ist), kann 
nur mit einer anderen, terminologisch bereits angedeuteten Perspektive auf eine 
infrage stehende Kommunikationsform erhellt werden. 

Für einen solchen Perspektivwechsel in der medienlinguistischen Analyse 
habe ich bereits an anderer Stelle plädiert (vgl. Meiler 2017): Dieser Perspektiv- 
wechsel besteht darin, nicht die medialen Figenschaften von Kommunikations- 
formen zu analysieren, mit denen sie verglichen und typologisiert werden kön- 
nen, sondern zu analysieren, wie diese Eigenschaften handlungspraktisch her- 
vorgebracht werden. Dieser Fokus auf die konkret zu leistende Arbeit an der Inf- 
rastruktur einer Kommunikationsform verdankt sich den praxistheoretischen 
Diskussionen innerhalb der Medienwissenschaft (vgl. Schabacher 2013) und der 
Techniksoziologie (vgl. Rammert/Schubert 2017) bzw. den Science and Techno- 
logy Studies (vgl. Star/Ruhleder 1996). Innerhalb dieser Diskussionen wird auf die 
alltäglich zu leistende Arbeit fokussiert, die die Vermittlung, die Medien leisten, 
allererst möglich macht. Damit ergänzt die Infrastrukturanalyse den strukturel- 
len Kommunikationsformenbegriff ideal mit einer Prozessperspektive. Metho- 
disch betreten Linguist*innen mit Infrastrukturanalysen jedoch weithin Neu- 
land. 
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The methodological implications of thle] relational approach to infrastructure are con- 
siderable. Sites to examine then include decisions about encoding and standardizing, tink- 
ering and tailoring activities [...], and the observation and deconstruction of decisions car- 
ried into infrastructural forms [...]. The fieldwork in this case transmogrifies to a combinati- 
on of historical and literary analysis, traditional tools like interviews and observations, sys- 
tems analysis, and usability studies. (Star 1999: 382) 


Fiir die Infrastrukturanalyse der Kommunikationsform Weblog kann das bedeu- 
ten, einerseits im Sinne der Techniksoziologie nachzuvollziehen, in welcher 
Weise das soziomaterielle Netzwerk Weblog fiir ein Mitglied einer spezifischen 
Praxisgemeinschaft zu knüpfen ist, wenn man selbstständig, d.h. plattformenun- 
abhängig, bloggen will. Dies kann bspw. über Systemanalysen, Selbstversuche, 
Interviews und im geeigneten Fall auch über die Analyse selbstreflexiver Kom- 
munikation methodisch erhellt werden. 

Exemplarisch kann die konkrete Arbeit an der Infrastruktur von Weblogs im 
folgenden Ausschnitt verdeutlich werden. Es handelt sich dabei um vier Zeilen 
des Quelltextes der Datei wp-config.php, die Bestandteil einer jeden WordPress- 
Installation auf einem Webserver ist. WordPress kann als eine der weit verbrei- 
tetsten Content Management Systeme betrachtet werden, die für das Bloggen ge- 
nutzt werden. 


Beispiel 1: Auszug aus dem Quelltext der WordPress-Datei wp-config.php (Ver- 
sion 3.8.1) 


define( 'DB_NAME', ‘database_name_here' ); 


[..] 

define( 'DB_USER', ‘username_here' ); 

[..] 

define('DB_PASSWORD', ‘password_here'); 
[..] 


define('WPLANG', 'de_DE'); 


Dem geschulten Auge gibt der Quelltext hier erkennbare Anweisungen (define) 
dariiber, was von User*innen zu tun ist, um einige wenige jener Schritte zu voll- 
ziehen, die notwendig sind, um die WordPress-Infrastruktur operabel zu machen 
und damit das Bloggen als kommunikative Praktik zu ermöglichen. In einem sehr 
konkreten Sinne muss die genannte Datei mit den vier, oben sichtbaren Spezifi- 
kationen versehen werden, um die einzelnen Programm-Komponenten (u.a. Da- 
tenbanken) aufeinander abzustimmen und in einem informatischen Sinne in die 
Lage zu versetzen, miteinander und mit den fundierenden Infrastrukturen des 
WWW kommunizieren zu können. Freilich stellt sich diese Aufbauarbeit nur je- 
nen, welche ihren Weblog unabhängig von einer Blogging-Plattform eigenver- 
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antwortlich unterhalten wollen. Der Nachvollzug dieser Arbeit an der Weblogin- 
frastruktur wurde im Rahmen der oben bereits erwähnten Studie methodisch 
über einen Selbstversuch im Rahmen eines Workshops zum Online-Publishing, 
über ein Interview mit einem Blogger sowie über Textanalysen geleistet, welche 
eine Reihe von Blogeinträgen des interviewten Bloggers zum Gegenstand hatten, 
in denen er reflexiv die Arbeit an der Infrastruktur i.d.R. dann zum Thema mach- 
te, wenn diese Probleme diverser Art aufwarf (vgl. Meiler 2018: 224-260). 

Die erwähnten Weblog-Plattformen, die mehr oder weniger explizit gerade 
das (inner-)wissenschaftliche Bloggen fördern und vereinfachen wollen, sind ge- 
rade mit Blick auf die infrage stehende Praktik auch wissenschaftspolitisch von 
Interesse. So stellt bspw. das Blogportal hypotheses.org seinen Blogger*innen 
die im obigen Beispiel nur angetippte Hard- und Software vollständig bereit und 
setzt sie folglich in eine grundlegend andere Beziehung zur Weblog-Infrastruk- 
tur. Diese Beziehung und ihre Auswirkung auf die Praktik innerwissenschaftli- 
chen Bloggens kann auf unterschiedliche Weise erforscht werden. Auch hier 
kommt man mit genuin linguistischen Analysen von Blogeinträgen nicht weit, 
weil diese in ihrer sprachlichen Gestalt die eigenen präsuppositionellen wie inf- 
rastrukturellen Voraussetzungen nicht immerfort selbst thematisieren (können), 
sondern sie bei zunehmender Etablierung vielmehr auch zunehmen fraglos vo- 
raussetzen müssen (vgl. Habscheid 2016). 

Die ethnografischen Methoden der teilnehmenden Beobachtung bzw. beo- 
bachtenden Teilnahme (vgl. Amann/Hirschauer 1997; Honer 2012), die die For- 
scher*innen selbst in die Lage versetzen, sich auf einen Sozialisierungsprozess 
in die infrage stehenden Praktik und Praxisgemeinschaft einzulassen, sind eine 
Möglichkeit, eine Plattform wie hypotheses.org und ihre platform politics (vgl. 
Gillespie 2010) einer Analyse zu unterziehen. Die Wahl einer solchen Methode 
stellt allerdings eine häufig unterschätzte Herausforderung für die gewohnten 
linguistischen Arbeits- und Schreibroutinen dar: Ein wesentlicher Kern ethnogra- 
fischer Forschung muss ja gewissermaßen darin gesehen werden, dass man zu- 
nächst sich (mit fieldnotes) ins Feld hineinschreibt und später schließlich wieder 
aus ihm herausschreibt (vgl. Emerson et al. 2001). Dies ist ein öffentlich zu plau- 
sibilisierender Prozess, der nicht in einer Fußnote vollzogen werden kann. 

Wenn man sich für die Analyse einer kommunikativen Praktik auf diese auch 
selbst einlässt, sollte dieser Teil des Forschungsprozesses also auch schreibend 
reflektiert werden. Die Beispiele 2 und 3 dokumentieren zwei Zeitpunkte des von 
mir unternommenen Aneignungsprozesses und der mit ihm einhergehenden So- 
zialisation als Wissenschaftsblogger (vgl. Meiler 2018: 260-283). Wie gleich ein- 
gangs erkennbar wird, hatte das Anlegen eines eigenen Blogs (im Juli 2013) im 
Rahmen meines Dissertationsprojektes zunächst andere Ziele verfolgt. Ursprüng- 
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lich wollte ich damit lediglich Einblicke in das Backend der medientechnischen 
Infrastruktur gewinnen, weil gerade dieses ja den Methoden hermeneutischer 
Textanalyse verborgen bleibt. 


Beispiel 2: Auszug aus einer Feldnotiz vom 12.4.2014 


Ich merke immer mehr, wie mein Blog mehr als nur ein Experiment wird - ja vielmehr ent- 
wickelt er sich zu meinem Baby, das wachsen und gedeihen soll. Angefangen hat es ja da- 
mit, dass ich nur die Produktionsbedingungen von medientechnischer Seite kennenlernen 
wollte. Jetzt greift wohl immer mehr eine sozio-technische Verwebung - ich nutze ihn [u.a.] 
als Raum zur Entwicklung von Gedanken [...]. Es entwickelt sich langsam eine Geschichte/ 
Vergangenheit/Tradition des Bloggens bei mir. [...] 


Beispiel 3: Auszug aus einer Feldnotiz vom 23.3.2015 


[...] Zudem entwickelte sich eine Diskussion auf meinem Blog darüber, wie richtiges Blog- 
gen aussehen könne und wie meine Einschätzung, sich nicht an Aufsätzen, sondern viel- 
mehr an Tagungsdiskussionen zu orientieren, von „den Wissenschaftsbloggern“ aufge- 
nommen wurde. [...] Deutlich wurde mir dabei aber vor allem, dass ich mich das erste Mal 
wirklich mit meiner eigenen Vorstellung vom wissenschaftlichen Bloggen auch normativ 
in der Blogosphäre zu Wort gemeldet habe. [...] 


Feldnotizen, wie sie hier in Auszügen wiedergegeben sind, sind methodische Mit- 
tel im ethnografischen Forschungsprozess. Als solche machen sie die Medialität 
von Schriftlichkeit produktiv, um die eigene Auseinandersetzung mit einem Feld 
reflektieren und objektivieren zu können. Die beiden Notizen — zwischen ihnen 
liegt immerhin ein Jahr, 13 verfasste Blogeinträge und eingehende linguistische 
Analysen von einigen Blogeinträgen u.a. vom SozBlog (s.u.) — halten zwei Um- 
schlagpunkte in meiner eigenen Auseinandersetzung mit dem wissenschaftli- 
chen Bloggen fest. Zusammen mit vielen anderen Feldnotizen zeichnen sie die 
Sozialisierung als Blogger, die vorstrukturierende Rolle, die die Plattform hypo- 
theses.org und ihre Plattformen-Politik dabei spielte, die Rolle der Beziehung zu 
anderen Bloggern, zur Software und ihren Affordanzen, zum Forschungsalltag 
im Allgemeinen und zum Dissertationsprojekt im Speziellen nach und machen 
sie einer Analyse zugänglich, die diesen Prozess retrospektiv reflektieren kann. 
Beispiel 2 und 3 machen dabei insbesondere deutlich, wie ich mich durch meine 
beobachtende Teilnahme mit meinem eigenen Blog auf der Plattform hypothe- 
ses.orgin einem Spektrum unterschiedlicher Auffassungen und Nutzungsweisen 
von Weblogs für die interne Wissenschaftskommunikation positioniert habe. 
Ausgehend von einer solchermaßen reflektiert zugänglichen Auffassung lässt 
sich u.a. die Differenz zwischen den Nutzungsweisen und bspw. ihren wissen- 
schafts- und publikationspolitischen Implikationen spezifisch beschreiben und 
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auch für die linguistischen Analysen fruchtbar machen, ohne einem Bias aufzu- 
sitzen, der sich aus den eigenen fraglos vorausgesetzten Präsuppositionen ein- 
stellt. 

Was über diese unterschiedlichen Methoden der Infrastrukturanalysen ge- 
wonnen werden kann, ist eine präzise Positionierung einer einzelnen Kommuni- 
kationsform, wie hier von Weblogs, im kommunikativen Haushalt einer konkre- 
ten Domäne, wie hier der Wissenschaft. Es kann beschrieben werden, wie die 
Beziehungen zu anderen Kommunikationsformen der Domäne zu charakterisie- 
ren sind, welche Gemeinsamkeiten und Unterschiede in Bezug auf mediale Stan- 
dards und soziale Verbindlichkeiten bestehen. Hinzu kommt selbstverständlich 
die Analyse des Gattungsspektrums dieser Kommunikationsformen, was freilich 
wieder zum methodischen Kerngeschäft der Linguistik gehört (vgl. Fritz 2011; 
Heinicke 2020). 

Schließlich bleibt noch eine letzte Perspektive einzuholen: Nachdem bisher 
der Fokus weitgehend auf den infrastrukturellen Bedingungen des eristischen 
Handelns lag, also darauf, die Medialität von Weblogs zu beschreiben, die für 
Zwecke interner Wissenschaftskommunikation genutzt werden sollen, scheint es 
zusätzlich ausgesprochen relevant, die „Medien“-Theorien der fokussierten Pra- 
xisgemeinschaften selbst zu analysieren, welche oben bereits als Kommunikati- 
onsformenwissen angesprochen wurden. Nur diese versetzen uns in die Lage, 
kulturanalytisch bestimmen zu können, welcher soziokulturelle Stellenwert, 
welche Verbindlichkeiten, aber auch welche Freiheiten in der Kommunikation 
einer (neuen) Kommunikationsform von der Praxisgemeinschaft selbst beige- 
messen werden. Methodisch sind verschiedene Wege denkbar, der unvermeidba- 
ren Außenperspektive, die durch (z.B. linguistische oder medienwissenschaftli- 
che) Altro-Kategorien gestiftet wird, auch eine Innenperspektive zur Seite zu 
stellen, um die Ethno-Theorien zu verstehen (vgl. Luginbühl/Perrin 2011), die 
bloggende Wissenschaftler*innen an ihre Blogging-Praktiken selbst anlegen. 

Gerade bei einer Praktik, die sich aktuell in Entwicklung befindet, in einer 
Domäne nicht gleichmäßig verbreitet und also kaum konventionalisiert ist, sollte 
die untersuchte Praxisgemeinschaft bei der Rekonstruktion dieses Aspektes 
nicht zu grob umrissen werden: Praktiken evolvieren in konkreten Gemeinschaf- 
ten, die stetsin Auseinandersetzung mit überkommenen Normen und Musterwis- 
sen situativ aufeinander bezogen handeln. So ließe die Analyse des Bloggens von 
Forscher*innen, die bspw. lediglich die verwendete Sprache Deutsch gemeinsam 
haben, kaum die Formierung der aktuellen Blogging-Praktiken beobachtbar wer- 
den, da die Unterschiede schlicht zu groß wären und ein gemeinsames, explizites 
oder implizites Wissen über die Praktik kaum zu unterstellen wäre. Fokussiert 
man allerdings eine konkrete Gemeinschaft wie z.B. die deutschsprachige Sozio- 
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logie, welche zudem über ein gemeinsames Blogprojekt (dem SozBlog) miteinan- 
der ins Gespräch kommt, ist man in der Lage, die Ethnotheorien zu rekonstruie- 
ren, die innerhalb dieser Gemeinschaft bezüglich ihrer Praxis unterhalten wer- 
den. 

Man kann freilich auf unterschiedlichen Wegen Zugang zu verschiedenen 
Aspekten dieser Ethnotheorien bekommen. Je stärker diese methodisch elizitiert 
werden, desto stärker wird es in den Daten Spuren sozialer Erwünschtheit und 
Ex-post-Rationalisierungen geben. Sofern aber entsprechende Texte greifbar 
sind, in denen sich die Akteur*innen selbstreflexiv über ihr Tun verständigen, 
können etwa unterschiedliche Formen von Diskurs- oder Inhaltsanalysen vorge- 
nommen werden.’ 

Die deutschsprachige Soziologie bietet hier einen geradezu idealen Ansatz- 
punkt für Analysen, da auf dem Blog der Deutschen Gesellschaft für Soziologie 
(und bezugnehmend auf diesen) rege Reflexions- und Diskussionstätigkeiten 
über das eigene Bloggen dokumentiert sind. Auf dem SozBlog war es im von mir 
herangezogenen Zeitraum (2011 bis 2016) ausgesprochen üblich, dass die dort re- 
selmäßig wechselnden Blogger*innen ihre Zeit auf dem Blog mit expliziten Re- 
flexionen davon beginnen (und manchmal auch beenden), was sie auf und mit 
dem Blog eigentlich tun. Aus diesen Selbstverständigungsprozessen der Praxis- 
gemeinschaft selbst, bestehend aus Blogeinträgen und umfangreichen Kommen- 
tarverläufen, lässt sich die „Medien“-Theorie, die Soziolog*innen vom Bloggen 
haben, nachzeichnen. Die Analyse dieser Blogeinträge und Kommentare, die me- 
thodisch am ehesten den Prinzipien einer Grounded-Theory-inspirierten, textlin- 
guistisch reflektieren Inhaltsanalyse entsprach, konnte aufweisen, dass diese 
Ethnotheorie keineswegs ein homogenes Ganzes, sondern vielmehr eine struktu- 
rierte Menge auch ideologisch aufgeladener Überzeugungen darstellt (vgl. Meiler 
2018: 283-312). Die eingehende Analyse dieser metakommunikativen Reflexio- 
nen hat dabei u.a. gezeigt, in welcher Weise die ethnotheoretischen Überzeugun- 
gen aufs engste an die Praxisgemeinschaft der deutschsprachigen Soziologie und 
ihre Selbstdeutungsdiskurse gebunden ist. Als wichtiges Stichwort kann in die- 
sem Zusammenhang Public Sociology gelten (vgl. z.B. Burawoy 2005; Scheffer/ 
Schmidt 2013). Die beiden folgenden Auszüge (s. Beispiel 4 & 5 unten) geben 


7 Wie die Analysen von Linthe (2020) verdeutlichen, ist jeweils eigens zu reflektieren, aus wel- 
chen empirischen Quellen Ethnotheorien bzw. -kategorien rekonstruiert werden sollen, weil sich 
diese einerseits als Bestandteile von Präsuppositionssystemen einzelner Praktiken nicht in ei- 
nem trivialen Sinne aus Sprechhandlungen ablesen lassen und sich andererseits in jeder empi- 
rischen Quelle für ihre Rekonstruktion andere Herausforderungen stellen in Abhängigkeit da- 
von, Ausdruck welcher Praktiken diese Quellen ihrerseits sind. 
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deswegen einen notgedrungen unvollständigen Einblick in lediglich einen der 
polar organisierten Bestimmungsmomente dieser Ethnotheorien wieder. 


Beispiel 4: Auszug aus einem Kommentar von Sascha Pommrenke vom 15.1.2013, 
11.59 Uhr zum SozBlog-Eintrag Bloggen als Arbeits- oder als Ausdrucksmedium 
oder als was? von Jo Reichertz (14.1.2013) (Absätze wurden im Zitat getilgt)® 


[...] Wurde und wird die veröffentlichte Meinung und der vermeintliche Diskurs in der Sozi- 
ologie durch etablierte Altvordere bestimmt, allein schon durch die Veröffentlichungsprak- 
tiken der verschiedenen Zeitschriften [...] verschafft [gerade das Blog] die Möglichkeit herr- 
schaftskritische Gedanken einer Leserschaft bereitzustellen, die gerade von den Etablierten 
nicht veröffentlicht würden. Sei es, weil der Gedanke nicht ausgereift genug ist, sei es, weil 
der Gedanke am Selbst- und Weltbild der Etablierten kratzt. [...] Es geht um die Möglichkeit 
seine Texte entgegen den Auswahl- und Ausgrenzungsmechanismen der etablierten Scien- 
tific Community veröffentlichen zu können. Das scheint mir ein wesentliches demokrati- 
sches Moment im Bloggen zu sein. 


Beispiel 5: Auszug aus dem SozBlog-Eintrag Was tun wir, wenn wir bloggen? von 
Manfred Prisching (5.5.2012)? 


[...] Es gibt das Verfertigen von Gedanken im Schreiben. Wissenschaftliche Aufsätze sind 
idealtypisch eher „fertige“ Produkte, abgerundet und ausgefeilt, Ergebnisse langfristiger 
Professionalität, und stilistisch fühlen sie sich oft dem „Gestus der Wahrheit“ verpflichtet. 
Blogs sind den Denkvorgängen näher. Sie nehmen Anstöße aus dem aktuellen Leben auf, 
aus dem Alltag, aus öffentlichen Ereignissen und aus den Medien — was man eben üblicher- 
weise als „öffentlichen Diskurs“ bezeichnet. Sie erlauben auch einen Blick in die Werkstatt 
der Wissenschaft, nicht nur in das Schaufenster. Man darf Überlegungen vorweisen, derer 
man sich noch nicht ganz sicher ist. Man darf Fragen stellen und sie offen lassen. Man darf 
sich gar ins Fragmentarische, Essayhafte wagen. Blogs erlauben es auch, sich den Erwar- 
tungen der Gesellschaft an das, was wissenschaftliche Disziplinen leisten sollen, besser an- 
zunähern: nicht im Sinne des Opportunismus oder der Banalisierung, sondern im Sinne 
einer Berücksichtigung von „allgemeineren“ (nicht gänzlich esoterischen, subsubsystemi- 
schen) Fragestellungen. Dieses Bloggen ist nicht eine Aktivität der Einigelung, sondern der 
Öffnung. [...] 


Die Pole dieses Bestimmungsmoments der Ethnotheorien soziologischen Blog- 
gens habe ich mit den Schlagworten Revolution vs. Reform gekennzeichnet. Sie 


8 Der vollständige Kommentar sowie der Eintrag von Jo Reichertz selbst finden sich hier: 
https://blog.soziologie.de/2013/01/bloggen-als-arbeits-oder-als-ausdrucksmedium-oder-als- 
was/#comment-8880 (Absätze wurden im Zitat getilgt). 

9 Der vollständige Eintrag findet sich hier: http://blog.soziologie.de/2012/05/was-tun-wir- 
wenn-wir-bloggen/. 
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beziehen sich auf eine konkrete Diagnose vom Publikationssystem der internen 
Wissenschaftskommunikation und projizieren auf die kommunikationsstruktu- 
rellen Potenziale von Weblogs entsprechende Hoffnungen bzw. Erwartungen auf 
Veränderungen. Während am reformorientierten Pol der Ethnotheorien Weblogs 
lediglich als Kompensatoren der Mängel bestehender Kommunikationsmöglich- 
keiten begriffen werden (s. Beispiel 5), deren Etablierung im und Fruchtbarkeit 
für den kommunikativen Haushalt der Wissenschaft sich aber allererst noch er- 
weisen muss, wird am revolutionsorientierten Pol ein blogeigenes Potenzial ge- 
sehen, an das jenseits einer Ergänzung ‚des Alten‘ die Hoffnung geknüpft wird, 
‚das Alte‘ nachhaltig — aber im Sinne seiner eigentlichen Ideale - zu verändern 
(s. Beispiel 4). 


4 Eristisches Handeln in wissenschaftlichen 
Weblogs Il: Handeln in Praxis 


Mit der Analyse der bisher umrissenen und exemplarisch erhellten Aspekte in- 
nerwissenschaftlichen Bloggens kann das konkrete sprachliche Handeln in der 
Praktik in einem solchen Sinne reichhaltig kontextualisiert werden, dass die 
i.e.S. linguistischen Analysen nicht abstrakte Zusammenhänge ohne Relevanz 
hervorbringen, sondern die Akteur*innenperspektive selbst rekonstruierbar ma- 
chen (vgl. Habscheid 2016). Sie können präzisieren, was es aktuell bedeutet, in 
soziologischen Weblogs eristisch zu handeln, welchen Stellenwert diese Hand- 
lungen innerhalb eines spezifischen disziplinären Diskurses haben und welche 
(normativen) Maßstäbe deswegen an sie angelegt werden oder gerade eben nicht. 
Ein letztes Beispiel soll versuchen, auch dies zumindest ausschnitthaft empirisch 
greifbar werden zu lassen. 

Der Kommentar, dessen Anfang Beispiel 6 (unten) wiedergibt, stammt aus 
einem längeren Kommentarverlauf, der mehrere Blogeinträge begleitete, die Hu- 
bert Knoblauch auf dem SozBlog über Populäres Wissen veröffentlichte. Er wurde 
von einem Soziologen verfasst, der - nach der Promotion mittlerweile in der sog. 
freien Wirtschaft tätig - unter dem Pseudonym Beobachter der Moderne selbst 
soziologisch bloggt und auf dem Blog der Deutschen Gesellschaft für Soziologie 
auch recht regelmäßig kommentiert. Am wiedergegebenen Ausschnitt soll ledig- 
lich ein Gesichtspunkt herausgehoben werden. Eine umfängliche Analyse eristi- 
schen Handelns in soziologischen Weblogs ist in Meiler (vgl. 2018: 313-521) zu 
finden, sie ist methodisch als Kommunikationsanalyse im Zuschnitt einer herme- 
neutischen Linguistik vorgenommen worden, die ihr reflektiertes Vorverständnis 
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neben dem u.a. funktional-pragmatischen sowie medienlinguistischen Forschungs- 
stand zum Gegenstand v.a. aus den in Abschnitt 3 angetippten Teilstudien 
schöpfte (vgl. ebd.: 47-101). 

Was in diesem ersten von zwei Absätzen vom Beobachter der Moderne sprach- 
handelnd v.a. getan wird, kann als impliziter VORWURF eines Bruches mit einem 
spezifischen Gebot der Wissenschaftskommunikation betrachtetet werden, des- 
sen ungebrochene Geltung im Kontext des Bloggens verunsichert zu sein scheint. 


Beispiel 6: Auszug aus einem Kommentar des Beobachters der Moderne vom 
10.8.2013, 9.15 Uhr zum SozBlog-Eintrag Schütz‘ „gut informierter Bürger“, die di- 
alogischen Medien und die Transformation der Wissensvermittlung (Populäres 
Wissen 3) von Hubert Knoblauch (6.8.2013)! 


(1) Lieber Herr Knoblauch, 


(2) dass die Kritik des Sender-Empfänger-Modells nicht von Luhmann stammt weiß ich. (3) 
Ich hab mich dabei auch nicht auf Luhmann bezogen. (4) Sie sollten mich nicht für einen 
sturen Systemtheorie-Dogmatiker halten. (5) Wenn Sie sich die Zeit nehmen und meinen 
Blog überfliegen, werden Sie feststellen, dass ich ein durchaus kritisches Verhältnis zu den 
etablierten Ansätzen pflege. [...] 


Wie das zusammengesetzte Verweiswort dabei aus (3) indirekt (d.h. qua Verweis 
auf die definit determinierte Nominalphrase die Kritik) zu erkennen gibt (vgl. 
Rehbein 1995; Redder 2009), baut dieser Kommentar auf mindestens zwei weite- 
ren, vorangehenden Kommentaren auf (die hier nicht wiedergegeben werden 
können; vgl. Meiler 2018: 446-478): Der erste Kommentar stammt vom Beobach- 
ter der Moderne und enthält die Ausgangsäußerung p. Darauf folgt der zweite 
Kommentar von Knoblauch, der u.a. die Äußerung q enthält, welche eine spezi- 
fische Lesart von p zu erkennen und diese Lesart BELEHREND zu verstehen gibt. Die 
Äußerung q ist im dass-Satz von (2) illokutiv neutralisiert wiedergegeben, um die 
Lesart, die q von p dokumentiert, ZURÜCKZUWEISEN. Der deiktische Bestandteil von 
dabei aus (3) refokussiert zum Zwecke der KORREKTUR (vgl. Rehbein 1984) auf p. 
Diese KORREKTUR wird zum Anlass genommen, um in (4) das Image" vom „sturen 


10 Der vollständige Kommentar von jenem Soziologen, der unter dem Pseudonym Beobachter 
der Moderne bloggt, sowie der Eintrag von Hubert Knoblauch selbst finden sich hier: 
https://blog.soziologie.de/2013/08/schuetz-gut-informierter-buerger-die-dialogischen-medien- 
und-die-transformation-der-wissensvermittlung-2/#comment-24841. Nummerierung von mir. 
11 Der Wissensstrukturtyp Image ist davon gekennzeichnet, dass individuelle, zu einem „Bild“ 
verfestigte „Einschätzungen“ überindividuell verallgemeinert werden und sich als solche Ver- 
festigung verselbständigen (Ehlich/Rehbein 1977: 53). 
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Systemtheorie-Dogmatiker“ ZURÜCKZUWEISEN, auf dessen Basis sich der Beobach- 
ter der Moderne offenbar behandelt sieht. (5) BEGRÜNDET diese Zurückweisung 
VERSICHERND. Vor dem Hintergrund, dass der Beobachter der Moderne im ersten 
Kommentar, also jenem Kommentar, der die Äußerung p enthielt, zwei Mal ex- 
plizit auf Einträge in seinem eigenen Blog verweist (und verlinkt), erlangt (5) 
durchaus eine VORWURFSqualität. Diese entfaltet sich maßgeblich auf Basis des 
von Weinrich (1986) treffend bezeichneten Rezeptionsgebots, dem hier nicht ent- 
sprochen wurde, denn sonst - so die Pointe von (5) - wäre es nicht zur Sub- 
sumtion des Beobachters der Moderne unter das erwähnte Image gekommen. 

Betrachtete man diese Sprechhandlungsverkettung (vgl. Ehlich 1983: 35) le- 
diglich vor der Vergleichsfolie der hier vorliegenden massenmedial verdauerten 
Schriftlichkeit, wie sie bspw. auch die Publikationen in wissenschaftlichen Zeit- 
schriften kennzeichnet, wäre ihr eine ganz andere (auch eristische) Brisanz zu- 
zuschreiben. Die aktuelle Stellung von Weblogs im kommunikativen Haushalt 
(vgl. Luckmann 1988) der Wissenschaft, hier insbesondere der deutschsprachi- 
gen Soziologie, gibt solchen mehr oder weniger kontroversen Auseinanderset- 
zungen aber auch einen anderen Stellenwert. Dies zeigt sich sprachlich z.B. 
ebenso in den expliziten Anredeformen (s.o.), welche die diskursiven Qualitäten 
eines 1:1-Dialogs kommunikativ eher relevant setzen (vgl. Meiler 2020), anstatt 
die einzelnen Kommentare als Beiträge zu einer Kontroverse zu rahmen, die vor 
einer entsprechend einschlägigen Community ausgetragen wird. Entsprechend 
erweisen sich die Normen und Maximen, die an solche Auseinandersetzungen im 
SozBlog angelegt werden, auch eher als jene, die an Wissenschaftskommunika- 
tion in diskursiven Kommunikationsformen angelegt werden.” 

Einzelne Handlungen erlangen also, wie hier nur exemplarisch gezeigt wer- 
den konnte, ihre soziokulturelle Bedeutsamkeit immer erst im Kontext von kon- 
kreten Praktiken, im Rahmen derer sie verstanden werden. „Schließt man sich 
einer solchen Sichtweise an“, wie sie bspw. Stephan Habscheid entwirft, 


stehen Handlungen und Praktiken nicht in einer Relation des Gegensatzes zueinander: 
Vielmehr werden Handlungen als in kulturelle Praktiken und soziale Ordnungen eingebet- 
tet begriffen, die für die Realisierung der Handlungen den Hintergrund bilden. (Habscheid 
2016: 134) 


Kommunikatives Handeln zu analysieren, setzt deswegen immer auch relevant, 
einen verlässlichen Zugang zu den Hintergründen zu erlangen, auf denen dieses 


12 Diese Befunde werden z.B. auch von einer recht hohen Fehlertoleranz (v.a. mit Blick auf un- 
terbliebene Korrektorate der Blogeinträge vor ihrer Veröffentlichung) gestützt und können auch 
unmittelbar an die oben angetippten „Medien“-Theorien rückgebunden werden. 
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Handeln genauso aufsitzt wie es sie mitgestaltet. Die Wechselseitigkeit des Ver- 
hältnisses zwischen Handeln und Praxis, erschwert nun, wie bereits gesagt, die 
Erforschung sprachlichen Handelns in aktuell evolvierenden Praktiken, weil sich 
sozusagen beide Enden, die kommunikativen Mittel ebenso wie die Hintergründe 
ihres Gebrauches, gleichermaßen in Bewegung befinden. 

Daher dürfte - noch für eine nicht unerheblich lange Zeit — eine besondere 
Herausforderung für die linguistische Pragmatik, die Kommunikation im WWW 
untersucht, insbesondere darin bestehen, dynamische Wandelprozesse analysie- 
ren zu müssen, die bisher nur wenig gesellschaftlich oder auch nur gemeinschaft- 
lich verallgemeinertes Musterwissen entstehen lassen haben.” Umso wichtiger 
werden methodische Zugänge sein, die ethnografisch reichhaltige Einblicke in 
verhältnismäßig eng abgegrenzte Praxisgemeinschaften gewähren, wie sie oben 
umrissen wurden. 

Solche Zugänge ermöglichen nicht nur eine dichtere Beschreibung der ana- 
lysierten Praktik des (z.B. soziologischen) Bloggens, sondern informieren in nicht 
unerheblichen Ausmaß auch die linguistischen Analysen der Blogeinträge und 
Kommentarverläufe. Die Infrastrukturanalysen, welche die Kommunikationsfor- 
menbeschreibung von Weblogs ergänzen, können z.B. die unterschiedlichen 
Wissenschaftspolitiken sichtbar machen, die faktisch wie auch strategisch von 
einzelnen Initiativen mit dem Bloggen verbunden werden. Die Analysen der ak- 
teur*innenseitigen Ethnotheorien (s.o.) ebenso wie eine eigene beobachtende 
Teilnahme können der jeweils verfolgten Fragestellung theoriegeleitete Biases 
nehmen und somit eine unvorhergesehene Bandbreite fruchtbarer Vergleichsho- 
rizonte eröffnen, die die präzise Lokalisierung einer konkreten Praktik in der 
Wirklichkeit einer spezifischen Domäne erst ermöglicht (vgl. Meiler 2021a). Mit 
Blick auf Blogging-Praktiken betrifft dies v.a. die Überwindung eines Schriftlich- 
keits- ebenso wie eines Mündlichkeits-Biases, was einen kontrastiven Zugang zu 
wissenschaftlichen Gattungen aus textuellen wie auch aus diskursiven Kommu- 
nikationsformen nötig macht. Weblogs aufgrund ihrer Schriftlichkeit allein text- 
linguistisch zu analysieren, griffe also zu kurz. 

Des Weiteren macht die Einsicht in die Heterogenität, mit der das innerwis- 
senschaftliche Bloggen derzeit betrieben wird, einerseits deutlich, wie eng die 


13 Wie eingangs angedeutet kann die Reorganisation des kommunikativen Haushalts (bzw. al- 
ler kommunikativen Haushalte) infolge der Digitalisierung als so grundlegend wie umfassend 
betrachtet werden, dass die angestoßenen Veränderungsprozesse auch auf die ‚übrigen‘ Kom- 
munikationsprozesse zurückwirken und auch diese Praktiken mitunter grundlegenden Umwäl- 
zungen unterwerfen (vgl. dazu grundlegend Bolter/Grusin 2000), weswegen auch bei deren 
Analysen methodisch scheinbar selbstverständlich Voraussetzbares zunehmend infrage gestellt 
werden muss. 
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jeweils untersuchte Praxisgemeinschaft gezogen werden muss, um von dieser 
ausgehend kontrastiv zu verallgemeinern.' Andererseits wird dadurch versteh- 
bar, welche soziokulturelle Geltung eine spezifisch zum Ausdruck gebrachte 
Handlungsqualität in einem Blogeintrag im Vergleich zu einem anderen inner- 
halb der untersuchten Praxisgemeinschaft hat. 


5 Umrisse einer Systematik 


Ausgehend vom konkreten Fall eristischen Handelns innerhalb der Praktik in- 
nerwissenschaftlichen Bloggens sollen nun die Umrisse einer Methodensystema- 
tik zu skizzieren versucht werden, die der dargestellten Aspektheterogenität u.a. 
sprachlich konstituierter Praktiken gerecht zu werden vermag. Die Analyse sol- 
cher Praktiken bedarf, wie deutlich geworden sein sollte, jeweils einer methodi- 
schen Rücksichtnahme auf sowohl die Medialität als auch die Kulturalität des 
Phänomens und muss beide in ihrer Dialektik stets methodologisch, also in Be- 
zug auf die Gegenstandskonstitution, reflektieren (vgl. Meiler 2019) wie ebenso 
die Möglichkeiten adressiert werden müssen, die Ergebnisse einzelner, je unter- 
schiedlicher Methoden in ein umfassendes Gegenstandsverständnis zu (re-)in- 
tegrieren.” 

In Abschnitt 3 & 4 wurden einzelne Aspekte innerwissenschaftlichen Blog- 
gens und ihre methodische Einholung abgeschritten. Ausgehend davon soll jetzt 
versucht werden, einige systematische Bereiche des sich abzeichnenden Gesamt- 
bildes zu skizzieren. Als Ausgangspunkt kann dabei die Einsicht dienen, dass 
eine sprachlich-kommunikative Praktik nie aus jenen Daten heraus vollstandig 
rekonstruierbar wird, die durch ihren Vollzug entstehen. Die Hinter- und Unter- 


14 Denn nur in Gemeinschaften gemeinsamen Tuns entwickeln sich die fiir eine Gemeinschaft 
sozial verbindlichen Formen dieses Tuns. Von solchen Ganzheiten kann dann kontrastierend 
ausgegangen werden, um die Verschiedenheiten in den Blick zu bekommen, die andere Praxis- 
gemeinschaften auszeichnen: bspw. soziologisches Bloggen (vgl. Meiler 2018: 283-312) vs. Blog- 
gen von Archäolog*innen (vgl. Caraher/Reinhard 2015). 

15 Die hier skizzierte Systematik versteht sich dabei komplementär zu und als Erweiterung von 
Klemms/Michels (2014) Vorschlag einer Medienkulturlinguistik, der maßgeblich in einer pha- 
sierten Methodologie besteht und dabei nach Produktions-, Produkt- und Rezeptionsanalysen un- 
terscheidet. Demgegenüber fokussiert der hier gemachte Vorschlag primär die unterschiedli- 
chen Aspekte der infrage stehenden Gegenstände selbst, die in den Praktiken aller drei Phasen 
(so sie unterscheidbar sind) präsent sind. Eine solche Phasierung ist ohnehin nicht für alle Kom- 
munikationsprozesse gleichermaßen fruchtbar (Massenkommunikation vs. Face-to-face- oder 
Netzwerkkommunikation). 
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gründe von Praktiken (vgl. Habscheid 2016) müssen auf anderem Wege (und da- 
her mit anderen Daten) erschlossen werden und diese sind — gerade im medialen 
Raum der Digitalität - vielgestaltig. 


Hermeneutik / Form-Funktionsanalyse 
Beob. Teilnahme Interaktions-/Textanalyse 


Teiln. Beob. Interviews Systemanalyse 
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Abbildung 1: Methodensystematik zur Erforschung sprachlichen Handelns in kommunikativen 
Praktiken, jeweils entfaltet nach den medialen (senkrecht) und kulturellen (waagerecht) As- 
pekte der Phänomene Handeln, Praktiken/Praxis, Kommunikationsformen, Infrastrukturen und 
jeweils diesen Aspekten zugeordneten Methoden. 


Abbildung 1 versucht einen Überblick zu geben, der sowohl die Struktur- und 
Prozessperspektive auf die einzelnen linguistischen Gegenstände wie auch ihre 
mentalen wie materialen und medialen Aspekte berücksichtigt und den davon 
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aufgespannten empirischen Phänomenen konkrete Methoden zuordnet. Einige 
Bemerkungen seien dem noch angeschlossen. 
Oben wurde auf die folgenden Aspekte des Gegenstands eingegangen: 


(a) 


(b) 


(c) 


(d) 


(e) 


Sprachlich-kommunikative Praktiken finden immer unter diversen me- 
dialen Ermöglichungsbedingungen statt, die sich in Form diverser Kom- 
munikationsformen stabilisieren. 

Grundlage dieser Stabilisierungen sind die jeweiligen soziotechnischen 
Infrastrukturen, denen Kommunikation immer aufsitzt. Konkrete medi- 
ale Infrastrukturen werden in unterschiedlichen Domänen auf je unter- 
schiedliche Weise herangezogen, genutzt, gepflegt, adaptiert und inte- 
griert. 

So wie die Kommunizierenden ein (produktives und/oder rezeptives) 
Wissen um diverse Gattungsstrukturen haben, haben sie auch ein Wis- 
sen von den medialen Bedingungen, unter denen sie an Kommunikati- 
onsprozessen (in unterschiedlichem Umfang) teilhaben. 

Da eine gesellschaftliche Praxis i.d.R. in mehr als nur einer medial ge- 
bundenen Praktik gesellschaftlich vollzogen wird, kann das Wissen um 
die medialen Strukturen unterschieden werden von den Präsuppositio- 
nen (auch wenn beides nicht unabhängig voneinander ist, s.o.), die den 
Zwecken der Praxis und mithin ihrer Praktiken zugrunde liegen. 

Diese Präsuppositionen gehen ein in das, was man manchmal die Sem- 
antik oder Pragmatik sprachlicher Einheiten nennt (von Morphemen 
ebenso wie von Diskursen/Texten). Sie sind also zusammen mit dem 
(häufig als Grammatik aufgefassten) Strukturwissen unmittelbar rele- 
vant dafür, handlungspraktisch angemessen verstanden zu werden 
(von Akteur*innen ebenso wie von Analytiker*innen). Hier sind selbst- 
verständlich die anderen kommunikativen Modalitäten gleichermaßen 
zu berücksichtigen, mit denen Sprache in Praktiken eingeht. 


In Bezug auf (e) müssen hier nicht viele Worte verloren werden. Die Linguistik 
hat hier ihre Expertise und erweitert sie zunehmend in Richtung Multimodalität 
(vgl. z.B. Fricke 2012; Bateman et al. 2017). Die Analysemethoden (von gramma- 
tischen Strukturen bis hin zu Diskursen/Texten) zur Erforschung sprachlicher/ 
kommunikativer Mittel, ihrer Eigenschaften, Strukturen und ihrer Kombinatorik 
sind umfangreich, ausdifferenziert und in steter Entwicklung (vgl. Lobin 2018). 
Mitunter geraten hier aber die hermeneutische Grundvoraussetzung und die 
Dialektik aus Form und Funktion, die ihr Fundament ist (vgl. Ehlich 2007a, 
2007b), etwas aus dem Blick, die sich aber gerade für die Analyse sprachlich- 
kommunikativer Praktiken als unabdingbar erweisen - auch in Bezug auf die 
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anderen genannten Aspekte. Unabhängig davon sind gerade die linguistischen 
Methoden der Datenerhebung und -aufbereitung - vergleicht man sie etwa 
mit ethnografischen Beobachtungsmethoden - im Besonderen geeignet, die 
kommunikativen (multimodalen) Mittel, mit denen Praktiken vollzogen werden, 
präzisen Analysen zu unterziehen: 


Die Linguistik ist methodologisch weitaus besser als die Soziologie darauf vorbereitet, sich 
als Wissenschaft des Vollzugs von Praktiken zu verstehen. Die empirische Sprachwissen- 
schaft, die sich mit Texten und Interaktionen befasst, hat von Haus aus weniger Probleme 
als die meisten soziologischen Ansätze, empirische Phänomene in ihren konkreten Details 
und in der zeitlichen Struktur ihres Vollzugs zum Gegenstand der Analyse zu machen. (Dep- 
permann et al. 2016: 16) 


Die Analyse sprachlich-kommunikativer Praktiken kann sich aber ebenso wenig 
auf (e) zurückziehen, wie sie (a) bis (d) methodisch nur unsystematisch erschlie- 
ßen kann - v.a. wenn es um die Analyse sich neu entwickelnder oder im Umbruch 
befindlicher Praktiken geht. 

Kommunikationsanalysen kommen ohne die Kenntnis von (d) Relevanz- und 
Erwartungsstrukturen, auf denen sie unausgesprochen und unhinterfragt auf- 
bauen, nicht sehr weit. Wenn Analysen bereits vorhanden sind, kann man sich 
diese Präsuppositionen der infrage stehenden Praxisgemeinschaft einfach anle- 
sen (Metastudien). Man kann versuchen, sie durch Interviews zu elizitieren, 
was allerdings aufgrund der Knowing-how-Verfasstheit von Präsuppositionen ein 
schwieriges Unterfangen darstellt (vgl. Polanyi 1985: 13-31). Kommunikations- 
analysen (nach den Methoden der Gesprächs- & Textlinguistik) können sie dem- 
gegenüber erhellen, wenn sie - eine Unterscheidung von Paul (1999) aufgreifend 
— auf praktische oder handlungsentlastete Reflexionstätigkeiten der Akteur*in- 
nen fokussieren und also analysieren, wie die Akteur*innen selber praxiseigene 
Probleme behandeln. Freilich ist bei der Analyse wie auch bei der Einschätzung 
der Ergebnisse einerseits den Anlässen für die jeweilige Reflexionstätigkeit ange- 
messen Rechnung zu tragen, wie ebenso der Tatsache, dass in diesen selbstrefle- 
xiven Kommunikationsepisoden natürlich lediglich jenes Wissen zum Ausdruck 
kommen kann, das für die Akteur*innen unter den jeweiligen Umständen auch 
sagbar ist (vgl. Roth 2013). Die Analyse solcher Sagbarkeiten und der Rückschluss 
auf Wissensstrukturen von Gesellschaften oder Gemeinschaften, die diesen zu- 
grunde liegen, ist klassisches Terrain der (linguistischen) Diskursanalyse im An- 
schluss an Foucault (vgl. Warnke 2007; Warnke/Spitzmüller 2008). Im Prinzip 
sind hierfür auch qualitative Inhaltsanalysen durchführbar, wenn ihren bekan- 
nten Problemen sprachsensibel begegnet und im Sinne der Grounded Theory 
eine offene Kategorienentwicklung zugelassen wird (vgl. Titscher et al. 1998: 74- 
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107). Die erwähnten Sagbarkeitsgrenzen innerhalb des untersuchten Feldes kön- 
nen aber eigentlich nur ethnografisch unterlaufen werden. Denn der 


zentrale Anspruch der Ethnographie [...] ist es, die Sichtweise der beobachteten Akteure zu 
rekonstruieren. Erst durch das intensive Eintauchen in eine Kultur wird es möglich, die 
Weltsicht und den Deutungshorizont der Akteure zu bestimmen und zu rekonstruieren, 
welche Bedeutung einzelne Handlungen für sie haben. (Bergmann 2008: 328) 


Indem mittels teilnehmender Beobachtung oder beobachtender Teilnahme 
eine (Teil-)Sozialisierung in die fragliche Praxis angestrebt wird, ist ein Weg ge- 
wählt, mit dem die nicht trivialen Voraussetzungen für das Verstehen und Analy- 
sieren einer (kommunikativen) Praxis erlangt werden können. Kaum eine lingu- 
istische Analysemethode kann auf dieses hermeneutische Fundament verzichten 
(vgl. Meiler 2018: Kap. 3), wenn sie nicht ausschließlich auf (bedeutungslose) 
Formen und ihre Distribution aus ist; und eine kulturanalytische Medienlinguis- 
tik muss sich immer wieder selbst die Frage zumuten, ob in ihren Analysen nicht 
Präsuppositionen in Anspruch genommen werden, die nur vermeintlich als all- 
gemein geteilt vorausgesetzt werden können. Gerade die rezenten Praktiken auf 
den unterschiedlichen Plattformen des WWW sollten deswegen mit Bezug auf 
konkrete und überschaubare Praxisgemeinschaften erforscht und Erkenntnisse 
anschließend über kontrastive Analysen zu verallgemeinern versucht werden." 

Da einzelne Praxisgemeinschaften neue Infrastrukturen und Kommunikati- 
onsformen für ihre jeweiligen Zwecke in ihrem je eigenen Tempo und in ihrer je 
eigenen Art in Anspruch nehmen, stellen (c) die „Medien“-Theorien der Akteur* 
innen einen besonderen Ausschnitt präsuppositionellen Wissens dar. Da wir uns 
aktuell gesamtgesellschaftlich in einer Phase befinden, in der ganz neu ausgelo- 
tet wird, wofür Schrift bzw. schriftliche Kommunikation einsetzbar ist und wel- 
che Ansprüche wir an diese anlegen (ganz zu schweigen von den sich verschie- 
benden Macht- bzw. Marktverhältnissen zwischen Massen- und Netzwerkmedi- 
en), scheinen die Ethnotheorien über die medialen Bedingungen unserer Kom- 
munikation insgesamt in Bewegung.” Diese Wissenshintergründe lassen sich im 


16 Auf diesem Wege lässt sich - methodologisch der Grounded Theory folgend (vgl. Strauss/ 
Corbin 1996; Glaser/Strauss 2005) - auch auf dem Wege qualitativer Analysen sukzessive zu 
tragfähigen Generalisierungen kommen. Dass die Grounded Theory gerade im Hinblick auf die 
Methode des permanenten Vergleichs nicht theorielos vorgeht (ja vorgehen kann und also kein 
induktives Verfahren darstellt), hat z.B. Kelle (1994) gezeigt. 

17 Dies findet seinen Niederschlag nicht zuletzt in der Grammatikschreibung, die dem sog. 
Schriftstandard einen gesprochenen Standard gegenüberstellt (vgl. Schneider et al. 2018) oder 
nach einem digitalen Standard fragt (vgl. Abel et al. 2020), dabei aber nicht den Fehler begehen 
darf, von einem Bias in den nächsten zu verfallen (vgl. Fiehler 2015). 
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Prinzip mit denselben Methoden ermitteln wie jene unter (d) genannten (s.o.); 
für sie gelten mit Blick auf ihre Verallgemeinerbarkeit auch dieselben Einschrän- 
kungen. 

Diese Einschränkungen können mit den unterschiedlichen Methoden der 
Infrastrukturanalyse kompensiert werden. Die Analyse der (b) jeweiligen Infra- 
struktur nimmt jene Arbeit in den Blick, die geleistet werden muss, damit Kom- 
munikation unter (a) bestimmten Bedingungen möglich wird. Wie das im Ab- 
schnitt 3 wiedergegebene Zitat von Star (1999) verdeutlicht, sind die methodi- 
schen Möglichkeiten der Infrastrukturanalyse mannigfaltig und können sich 
historischer Dokumente, Interviews, der Analyse technischer Systeme oder der 
Analyse auf sie bezogener (kommunikativer) Problembewältigungen (‚Krisen‘) 
ebenso bedienen wie der teilnehmenden Beobachtung/beobachtenden Teilnah- 
me - natürlich stets in Abhängigkeit von der Offenheit des Feldes für Forschung 
und mithin der Zugänglichkeit des infrage stehenden Gegenstandes. 


6 Ausblick: linguistische Praxeologie 


Die den vorangegangenen Ausführungen zugrundeliegende These ist natürlich, 
dass sprachlich-kommunikative Praktiken oder sprachliches Handeln in kommu- 
nikativen Praktiken nur dann angemessen analysiert werden können, wenn die 
oben aufgefalteten Aspekte Berücksichtigung finden. Das betrifft die praxeologi- 
sche Analyse von Face-to-face-Kommunikation ebenso wie von Kommunikation 
mittels Massen- oder Netzwerkmedien. Zu berücksichtigen bleibt bei einem sol- 
chen sog. Mixed-Methods-Vorgehen, dass die Ergebnisse der einzelnen Untersu- 
chungen mit den jeweiligen Methoden einander nur ausgesprochen selten in ei- 
nem einfachen Sinne ergänzen können. Jede Methode ist performativ in dem 
Sinne, in dem sie mit ihrem Zugriff auf ein Phänomen einen für sie spezifischen 
Gegenstand hervorbringt (vgl. Kalthoff 2010). Dies erschwert die Triangulation 
‚eines Gegenstandes‘ (vgl. Flick 2011) mit unterschiedlichen Methoden unge- 
mein." Wie oben bereits angedeutet kann z.B. nicht angenommen werden, dass 


18 Mit Bezug auf Aspekt (e) allein thematisiert Schönefeld (2011) converging evidence, die sich 
aus unterschiedlichen Methoden ergeben kann. Das hier verfolgte Plädoyer würde im von ihr 
herausgegebenen Sammelband wohl nicht unter dem Aspekt des „methodological pluralism“, 
sondern unter „phenomenological pluralism“ diskutiert werden (Steen 2011: 33), was vor allem 
auf die Unterschiede in der deutschen und englischen (alltäglichen) Wissenschaftssprache (vgl. 
Ehlich 1994) zurückzuführen ist, da letztere zwischen Methode und Methodologie nicht strikt 
trennt. 
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die Ethnotheorien, die auf diskursanalytischem Weg aus Reflexionen der Ak- 
teur*innen rekonstruiert worden sind, für dieselben Akteur*innen in situ hand- 
lungsleitend sind. Der Vollzug selbst und seine Reflexion, Beschreibung oder Do- 
kumentation sind jeweils unterschiedliche Praktiken (vgl. Garfinkel 2000); eben- 
so wie narrative Interviews (vgl. Lucius-Hoene/Deppermann 2002), das Design 
eines (linguistischen) Experiments (oder die Teilnahme an diesem) oder das Ko- 
dieren von dokumentierten Kommunikationsdaten (vgl. Rehbein/Mazeland 1991) 
je eigene Praktiken sind. Als solche sind sie von genuin eigenen Präsuppositio- 
nen und Infrastrukturen gekennzeichnet, die ihrer eigenen methodischen Einho- 
lung bedürfen. 

Um eine kommunikative Praktik zu beschreiben (und um zu verstehen, wie 
darin sprachlich gehandelt wird bzw. wie sprachliche Mittel darin ihre Hand- 
lungsqualität entfalten können) bedarf es, wie mit Habscheid (2016) gesagt wur- 
de, der Kenntnis sowohl ihrer kulturellen wie auch ihrer medialen Hinter- und 
Untergründe. Versucht man, diese beiden Bereiche analytisch zu erschließen, be- 
darf es nicht nur je eigener Methoden, sondern es bedarf mit diesen Methoden 
ebenso einer je eigenen Perspektive, die die Aspektheterogenität des Phänomens 
Sprache über die Erforschung je spezifischer linguistischer Gegenstände einzu- 
holen ermöglicht (z.B. kommunikative Mittel und auf sie bezogenes strukturelles 
Wissen, diverse Präsuppositionsbestände unterschiedliche Praktiken betreffend, 
körperliche/technische Infrastrukturen etc.). All diese Gegenstände sind als As- 
pekte eines Phänomens über die zu erforschende Praktik miteinander verbunden 
(Reckwitz 2003). Meines Erachtens ist es daher gerade die Praxistheorie, welche 
die (Re-)Integration der einzelnen, methodisch gewonnen Perspektiven auf ein 
Phänomen in einem umfassenden Verständnis eines unaufhebbar aspekthetero- 
genen Gegenstands zu leisten vermag. 

Eine Linguistik, die sich dieser praxistheoretischen Herausforderung an- 
nimmt, könnte man praxeologische Linguistik nennen; oder vielleicht eher: lin- 
guistische Praxeologie. Diese hätte eine Integration u.a. der vorgenannten As- 
pekte in eine übergreifende Theorie zu leisten, welche als eine interdisziplinäre 
Theorie mit sozialtheoretischem Fundament zu konzipieren wäre (Meiler 2022). 
Der damit verbundenen Herausforderung wäre nicht angemessen entsprochen, 
wenn dem Praktiken-Begriff innerhalb der Sprachwissenschaft lediglich eine be- 
stimmte analytische Ebene zugewiesen wird, wie das aktuell mit superstruktu- 


19 Nach meiner Auffassung stellt die Funktionale Pragmatik (vgl. z.B. Redder 2008; Rehbein 
2001) gegenwärtig innerhalb der Linguistik den vielversprechendsten Ausgangspunkt für eine 
solche Theorieentwicklung dar, da sie bereits als Antwort auf die sog. pragmatische Wende sehr 
radikale Konsequenzen für die linguistische Begriffsbildung gezogen hat. 
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rellen, makrostrukturellen oder mikrostrukturellen Praktiken-Begriffen geschieht 
(vgl. Deppermann et al. 2016: Kap. 3). Eine solche Strategie, die der Praxistheorie 
innerhalb der Sprachwissenschaft eine der vorgenannten Analyseebenen zuwie- 
se, die übrigen Ebenen (wie z.B. die Grammatikschreibung) jedoch unangetastet 
ließe, bewältigte die Herausforderung aber vor allem terminologisch und adres- 
sierte so kaum die Herausforderung, die für die linguistische Gegenstandskonsti- 
tution wie auch für die Forschungsmethoden von ihr ausgeht (Meiler 2019). Ihr 
analytisches Potenzial bliebe damit freilich nur unvollständig ausgeschöpft. 
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1 Einfiihrung: die Beziehung zwischen Linguistik 
und Multimodalitatsforschung 


Wenn man die wahre Natur der Sprache entdecken will, muss man erst einmal dem Beach- 
tung schenken, was sie mit allen anderen Systemen gleicher Ordnung teilt. (Saussure 2001 
[1916]: 22) 


Wie in mehreren Beiträgen dieses Bandes angemerkt, beruhen kommunikative 
Situationen zunehmend auf einem Gebrauch von Sprache (gesprochen sowie 
schriftlich), der explizit und bewusst andere Zeichenarten mit einschließt (vgl. 
Schmitz 2004, 2016; Kesselheim 2011; van Leeuwen 2020). Die Tatsache, dass Zei- 
chensysteme gemeinsam eingesetzt werden und stets ineinandergreifen, stellt 
besondere Herausforderungen an den theoretischen Rahmen, an die richtige 
Wahl der Terminologie und an die empirischen Methoden, die sich für ihre wis- 
senschaftliche Aufklärung als wirksam erweisen können. Dies gilt darüber hin- 
aus nicht nur für die sprachwissenschaftliche Diskussion, sondern für alle Dis- 
ziplinen, die sich mit einer oder mehreren der verwendeten Zeichenarten be- 
schäftigen. 

Für viele Akteure innerhalb der breitgefächerten Multimodalitätsforschung 
gilt die Linguistik als Hauptinspirationsquelle. Seit den bahnbrechenden Versu- 
chen von Barthes und anderen in den 1960er Jahren, grundlegende, weitgehend 
strukturelle Prinzipien der linguistischen Analyse, wie etwa das Aufzeigen von 
Systemen von Unterscheidungsmerkmalen (die sog. Komponentenanalyse), auf 
andere Zeichensysteme anzuwenden, hat es in der Tat eine ständige Erweiterung 
und Ausdehnung von ‚linguistisch motivierten‘ Analysen auf eine breite Vielfalt 
von semiotischen Entitäten gegeben. Wenn wir uns an Saussures Vorstellung er- 
innern, dass die Linguistik als Musterbeispiel und Hauptvertreter für die Unter- 
suchung anderer Zeichensysteme dienen könnte und vielleicht sollte (vgl. Saus- 
sure 1916: 80-81 und die Diskussion bei Krampen 1981: 106-107), wäre aufjeden 
Fall eine rege theoretische und methodische Interaktion zwischen etablierten Be- 
reichen der Linguistik und Versuchen, linguistische Prinzipien und Methoden 
auf ‚nonverbale‘ Systeme zu übertragen, zu erwarten. Diese fällt jedoch sehr un- 
terschiedlich aus, je nachdem, um welche Bereiche und Untersuchungsgegen- 
stände es sich handelt. Hier ist nicht der Ort, um einen detaillierten Überblick 
über den Stand dieser Zusammenhänge zu geben, aber es wird nützlich sein, so- 
wohl die Breite dieser Wechselwirkungen zu skizzieren, als auch einige Konse- 
quenzen zu erläutern. 

Es gibt ohne Zweifel eine Reihe von Dimensionen, die man für eine Klassifi- 
zierung der verschiedenen Ansätze verwenden könnte. Dies hängt auch vom 
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Zweck ab, für den eine Klassifizierung vorgenommen wird. Dabei ist es wichtig 
zu betonen, dass wir uns ausdrücklich auf klare Unterschiede bezüglich des Ein- 
satzes von empirischen Methoden zwischen verschiedenen Arten von Sprachthe- 
orien und ihrer Entwicklung in einem multimodalen Kontext beschränken wol- 
len. Dies lässt sich sinnvoll erreichen, indem wir zunächst eine Differenzierung 
hinsichtlich sprachlicher Abstraktionsebene und Art des betrachteten Phäno- 
mens treffen. Wir trennen ‚textlinguistische‘ (oder ‚Textebene‘) Ansätze, gram- 
matikzentrierte Ansätze und Ansätze, die sich mit kommunikativer Interaktion 
befassen. Darüber hinaus ist es insbesondere für die textlinguistischen Darstel- 
lungen sinnvoll, Entwicklungen im deutsch- und englischsprachigen Raum se- 
parat zu berücksichtigen, da diese sich auf recht diverse theoretische Positionen 
stützen und die Ansätze zur Multimodalität unterschiedlich beeinflusst haben. 
Es wird hier kein Anspruch auf Vollständigkeit erhoben: Unser Ziel ist es, die 
Breite der Palette der möglichen Beziehungen zwischen multimodalem Theoreti- 
sieren und korrespondierender linguistischer Theoriebildung aufzuzeigen. Dies 
wird zur Diagnose möglicher Lücken und vielversprechender weiterer Entwick- 
lungen genutzt werden. 

Zunächst haben sich deutschsprachige textlinguistische Ansätze, die bis in 
die Multimodalität hineinreichen, auf Text-Bild-Relationen konzentriert. Dabei 
stützen sie sich im Wesentlichen auf pragmatische und handlungstheoretische 
Darstellungen einerseits (vgl. Spillner 1982; Stöckl 2004a; Bucher 2011; Holly 
2009) und die Entwicklung verschiedener Textsortentypologien andererseits 
(vgl. Schmitz 2016, Meier 2014). Die Fokussierung auf Gebrauchssituationen führt 
ziemlich direkt zu Überlegungen zur rhetorischen Organisation, zu Argumentati- 
onsstrukturen und Topoi und zum Einfluss des Genres. Die für Multimodalitäts- 
studien wohl einflussreichste Richtung der englischsprachigen Textlinguistik ist 
demgegenüber der Diskursansatz der ‚Systemisch-Funktionalen Linguistik‘, wie 
er für Multimodalität maßgeblich in Kress & van Leeuwen (2006 [1996]) und 
O’Toole (2011 [1994]) artikuliert wird. Diese Modelle orientieren sich stark an der 
systemisch-funktionalen Charakterisierung von Grammatik und enthalten infol- 
sedessen viele Begrifflichkeiten, die direkt aus funktionalen Beschreibungen 
srammatischer Phänomene abgeleitet werden. Hervorzuheben sind hier auch 
Diskussionen, die auf verschiedenen Beziehungen auf Textebene basieren, wie 
z.B. Kohäsion (vgl. Royce 2016) und satzübergreifende Beziehungen (Martinec & 
Salway 2005). Eine völlig anders geprägte Forschungslinie bzgl. der Textebene 
stützt sich auf Varianten der in den 1980er entwickelten formalen Diskursreprä- 
sentationstheorie und dynamischen Semantik; multimodale Erweiterungen 
hierzu sind Bateman (2007), Abusch (2013) und Wildfeuer (2014, 2017). Die bisher 
erwähnten Bereiche stellen im Großen und Ganzen keine expliziten Verbindun- 
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gen zur Kognition her. Es gibt aber besonders um die Ebene des Satzes und der 
Grammatik herum mehrere kognitiv orientierte Forschungslinien, die sich mit 
multimodalen Phänomenen befassen. Neuere Ansätze zu konstruktionsbasierten 
Zugängen zur Sprache sind auch in den Bereich multimodaler Texte erweitert 
worden (Bergs & Zima 2017), und formale linguistische Ansätze mit kognitiven 
Grundlagen erforschen mittlerweile eine Reihe weiterer semiotischer Systeme, 
darunter Musik, Gestik und Tanz (vgl. Schlenker 2017; Patel-Grosz et al. 2019). 
Ansätze, die auf der kognitiven Linguistik und insbesondere der dort entwickel- 
ten Metaphertheorie fußen, sind auch überwiegend kognitiv affin (vgl. Forceville 
& Urios-Aparis 2009; Kappelhof & Müller 2011), obwohl sie sich seltener mit ex- 
perimentellen oder anderen Methoden aus der Psychologie oder den Kognitions- 
wissenschaften beschäftigen. Allerdings wurde eine umfassende kognitive Ar- 
chitektur für Multimodalität, die auf einer Reihe von empirischen Studien zu 
Bildsequenzen, wie sie in Comics zu finden sind, basiert, von Cohn (2016) in An- 
lehnung an Jackendoff (2007) dargelegt. Darüber hinaus gibt es in der Psycholo- 
gie angesiedelte Ansätze, die sich früher auf Themen wie das Diskursverstehen 
konzentriert haben und nun aktiv das multimodale Diskursverstehen verfolgen 
(vgl. Magliano et al. 1996; Zacks et al. 2009; Loschky et al. 2015). Schließlich ha- 
ben in den letzten Jahren Ansätze wie die Gesprächsforschung, die Konversati- 
onsanalyse und die Gestenstudien die differenzierten Analysen von Interaktion 
unter multimodaler Perspektive erforscht (vgl. Fricke 2012; Deppermann 2013; 
Mondada 2016; Deppermann & Streeck 2018; Norris 2019). Übersichten, Einfüh- 
rungen und kritische Diskussionen zu vieler dieser Arbeiten finden sich beispiels- 
weise in Bateman (2014), Stöckl (2016), Klug (2016), Adami (2017) und Wildfeuer 
et al. (2020). 

Diese Blitztour zeigt, dass mittlerweile umfassende Wechselwirkungen zwi- 
schen Linguistik (breit gesehen) und Multimodalitätsforschung bestehen. Den- 
noch ist die Art der Interaktion, die untersucht wird, je nach Gebiet sehr unter- 
schiedlich. Für die stärker kognitiv orientierten Bereiche und solche, die mit eher 
formalen Ansätzen der Grammatik zu tun haben, werden unterschiedliche empi- 
rische Ansätze eingesetzt. Das Untersuchungsmaterial in diesen Fällen erstreckt 
sich heute über Sprache hinaus und bezieht andere semiotische Systeme mit ein. 
Es besteht daher in diesen Fällen nach wie vor eine enge Beziehung zwischen der 
theoretischen Behandlung von Sprache und ihren multimodalen Pendants. In 
anderen Bereichen ist aber diese Verknüpfung schwächer geworden; je weiter 
man sich von den kognitiven und formalen grammatischen Bereichen entfernt, 
desto unklarer wird das Verhältnis zur Empirie. Obwohl dies eigentlich auch für 
die Linguistik gilt, ist die Lage im Bereich der Multimodalität um ein Vielfaches 
verschärft. Klug (2016) gibt einen nützlichen Überblick über verschiedene metho- 
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dische Orientierungen auf der Text- und Diskursebene und setzt diese in Bezug 
zur Multimodalität wie folgt. Als Grundlage stützt sie sich auf eine in der deut- 
schen Textlinguistik übliche Unterscheidung zwischen ‚Text‘ als eher produkt- 
orientierter, instanziierter Einheit der Kommunikation und ‚Diskurs‘ als inhärent 
transtextuelle Strukturierung kommunikativer Phänomene (vgl. Spitzmüller & 
Warnke 2011). Obwohl ‚reine‘ Fälle eines dieser beiden Extreme selten sind, gibt 
es dennoch eine annähernde Angleichung textsemantischer Ansätze mit detail- 
lierter Einzeltextanalyse und diskursemantischer Ansätze mit großangelegten, 
quantitativen Korpusstudien. Die Textsemantik ist also laut Klug eine primär 
‚bottom-up‘, punktuelle Mikroanalyse der Details von Einzeltexten, während die 
Diskurssemantik eine ‚top-down‘ Erfassung von textübergreifenden kommunika- 
tiven Strukturen anstrebt. 

Jede individuelle Detailanalyse kann es ermöglichen, interessante und auf- 
schlussreiche Interpretationen über einen einzelnen Text und die Formen des 
kulturellen Wissens zu erzählen, die hinter dem Text ‚stehen‘. Ein tieferes theo- 
retischen Verständnis erfordert aber auch empirisch abgesicherte Verallgemei- 
nerung, um linguistisch von Interesse zu sein. Eine wichtige Voraussetzung für 
die Erschließung von Generalisierungen ist es deshalb, die Form der einzelnen 
Analysen auf allgemeinere Kategorien zu beziehen. In der deutschen textlinguis- 
tischen Tradition geschieht dies üblicherweise durch die Zuordnung von Katego- 
rien über verschiedene Beschreibungsebenen hinweg, so genannte Mehrebenen- 
modelle, die heute in der Regel zumindest einige multimodale Komponenten 
enthalten (Spitzmüller & Warnke 2011; Gardt 2012). Solche Modelle werden als 
Eckpunkte für detaillierte Analyse angesehen, als „ein helfender, jedoch lockerer 
Rahmen der Rekonstruktion von Bedeutungszuschreibungen im angestrebten 
Sinne“ (Klug 2013: 172). Stöckl etwas ausführlicher dazu: 


Jeder multimodale Text realisiert eine Textsorte (z.B. Infografik, Zeitungsnachricht, Werbe- 
anzeige), die sich in einem Mehr-Ebenen-Modell beschreiben lässt. Dabei sind textlinguis- 
tische Basiskonzepte wie Kohäsion, Kohärenz oder Textstruktur (thematisch, Handlungs- 
struktur) etc. hilfreich, um multimodale Integration im Gesamttext zu erklären. Von zen- 
traler Bedeutung ist die Frage, wie stark typisiert die einzelnen Modalitäten verwendet wer- 
den und wodurch sich die multimodalen Texturen der einzelnen Textsorten unterscheiden. 
(Stöckl 2016: 5) 


Wir werden besonders diese letztere Frage der Typisierung von ‚einzelnen Moda- 
litäten‘ weiter unten in Detail wieder aufgreifen. 

In der Systemisch-Funktionalen linguistischen Tradition wird dies im Prinzip 
ähnlich gehandhabt, indem Beschreibungen über verschiedene Ebenen (die so- 
genannten ‚Strata‘ des linguistischen Systems) hinweg in Beziehung zueinander 
gesetzt werden und zwischen ‚Instanzen‘ und ‚Potentialen‘ unterschieden wird 
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(Halliday 1992). Das Potential ist eine Beschreibung dessen, welche Kategorien 
und Kombinationen von Kategorien in einem semiotischen System überhaupt 
verfügbar sind, und Instanzen sind spezifische Produkte, die im Hinblick auf die- 
ses Potential konstruiert wurden. Natürlich hängt das Ausmaß, in dem von de- 
taillierten Einzelanalysen zu größeren korpusbasierten Studien übergegangen 
werden kann, erheblich davon ab, wie zuverlässig einzelne Kategorien Textin- 
stanzen zugeordnet werden können und wie gut diese individuellen Kategorien 
sich in allgemeineren, aber dennoch gut validierten transtextuellen Beschrei- 
bungsrahmen verankern lassen. 

Dieses Verfahren ist in der Linguistik recht gut verstanden und die meisten 
Kategorien und organisierenden Strukturierungen, die in den diversen Mehrebe- 
nenmodellen aufgelistet werden, sind linguistisch gut motiviert. Dies ist für die 
multimodalen Erweiterungen allerdings nicht der Fall. Das Hinzufügen von 
Überlegungen zur Multimodalität zeigt einige wichtige methodologische Unter- 
schiede zwischen den disparaten Ansätzen auf und macht entsprechenden Lü- 
cken sichtbar. In der deutschen textlinguistischen Tradition gibt es eine lange 
Geschichte von gebrauchsbezogenen, pragmatischen Kommunikationsorientie- 
rungen; Analysen werden daher in der Regel als Mittel zur Aufdeckung der 
pragma-semantischen Konstruktion von kognitiv verankertem gesellschaftli- 
chem Wissen angesehen. Spezifische Textphänomene auf jeder der Beschrei- 
bungsebenen, die in irgendeinem angenommenen Mehrebenenmodell vorgese- 
hen sind, stehen dann als Anhaltspunkte für die Beschreibung von soziokul- 
tureller und kognitiver Wissenskonstruktion zur Verfügung. Es ist daher nahelie- 
send, diese mehrebenen-bezogenen Fragenkataloge beizubehalten, aber mit ei- 
ner Verschiebung über die rein sprachlichen Aspekte hinaus. Aber wie sollten die 
Merkmale und Kategorien der nicht-verbalen Ebenen aussehen? 

Hier finden sich Mischungen von Elementen wie Linien, Punkte, Konturen 
usw. für Bilder (manchmal als Bildzeichen benannt), oder Oberflächen-Beschrei- 
bungen wie räumliche Anordnungen für Seitenkomposition usw., wobei deren 
genauer Beitrag zur Bedeutung unklar bleibt. Zugleich wird angemerkt, dass es 
zum Beispiel bei visuellen semiotischen Systemen erhebliche Probleme gibt, 
überhaupt sinnvolle Bestandsteile bzw. analytische Einheiten zu definieren. Be- 
deutungstragende Elemente scheinen eher vom Gesamttext abzuhängen, und 
daher droht jede Analyse in einen Teufelskreis zu geraten. Wenn erkennbare und 
immanent bedeutungstragende Einheiten sich nicht festlegen lassen, ist die tra- 
ditionelle linguistische Art der Analyse am Ende. Dies ist aber bei eher ikonisch 
funktionierenden semiotischen Systemen fast immer der Fall. Eine zentrale For- 
schungsherausforderung besteht also darin, die herkömmlichen linguistischen 
Methoden für multimodale Phänomene entsprechend zu erweitern, sowohl, wie 
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Klug deutlich macht, im Sinne differenzierter qualitativer Analysen als auch in 
Form von breit angelegten quantitativen Korpusstudien: 


Dabei ist methodisch die Frage nach der Anwendbarkeit weiterer qualitativen Methoden 
auf multimodale Textkorpora ebenso zu stellen wie die Möglichkeiten quantitativer, com- 
putergestützter semantischer Analysetools auf multimodale Gegenstände auszuloten sind: 
Wie können typographische Charakteristika von Texten, die ihnen zugehörigen bildlichen 
und grafischen Anteile auch in digitalen Korpora abgebildet werden? Wie lassen sich bei- 
spielweise Bilder semantisch annotieren? Diese und andere Fragen sollten vermehrt ins 
Forschungsinteresse text- und diskurssemantischer Analysen rücken. (Klug 2016: 185) 


Leider steht die Antwort auf diese Fragen noch aus. Klug (2013) scheint sogar be- 
reit zu sein, den Anspruch auf entsprechende Methoden für visuelle Zeichensys- 
teme aufzugeben: 


Wo dem Analytiker zur Beschreibung sprachlicher Diskursbeiträge also qualitative und 
quantitative Analyseverfahren zur Verfügung stehen [...] ist eine semiotisch erweiterte Dis- 
kursanalyse - zumindest mit Blick auf ihre bildlichen Anteile - immer eine qualitative Ana- 
lyse, die den Einzeltext in den Blick nimmt. (Klug 2013: 183) 


Kurz zusammengefasst: Innerhalb der deutschen textlinguistischen Tradition 
kommt die Beschäftigung mit den verschiedenen Formen multimodaler Phäno- 
mene zu kurz. Beschreibungen bleiben weitgehend intuitiv. Begriffe wie Text, 
Bild usw. werden vorausgesetzt und sind schwach theoretisiert. Daher operieren 
die meisten multimodalen Analysen immer noch mit alltäglichen Begrifflichkei- 
ten (Stöckl 2016). Obwohl dies nicht bedeutet, dass solche Kategorien und Diffe- 
renzierungen automatisch falsch sind, ist dies für ein solch zentrales Konzept wie 
die semiotische Modalität eine auf die Dauer fragwürdige Forschungsstrategie. 
Es fällt sicher leicht, sagen zu können, dass dieses Buch Text und Bilder hat, oder 
dass ein Film Geräusche, gesprochene Sprache und bewegte Bilder einsetzt. Dies 
mag für einige Fragestellungen schon ausreichend sein, wenigstens um die For- 
schung in Gang zu bringen. Dass das aus der Perspektive der tieferen Grundlage 
einer Multimodalitätstheorie nicht ausreicht, wird offensichtlich, wenn man be- 
obachtet, wie schnell Versuche dieser Tradition, Zeichenmodalitäten mit einer 
präziseren Definition zu bestimmen, ins Schleudern kommen (vgl. Stöckl 2004b; 
Schmitz 2016 u.v.a.m.). Noch häufiger werden die verwendeten Kategorien ohne 
genauere Definition einfach hingenommen. Mischkategorien werden dann zur 
Norm, wodurch es zu heterogenen Gruppierungen von Phänomenen kommt, die 
empirische Forschung jeglicher Art stark erschweren. Mischkategorien können 
aus zwei Gründe zustande kommen: Entweder weil die Phänomene selbst un- 
klare Grenzen haben oder weil die angewandten Kategorien unangemessen sind. 
Diskussionen von Multimodalität schlagen häufig das erstere vor, hier wird dage- 
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gen argumentiert, dass der zweite Grund eine wichtigere Rolle spielt. Auch des- 
wegen wird der Einsatz breiter empirischer Methoden kritisch sein. 

Die multimodale Erweiterung des Systemisch-Funktionalen Ansatzes im 
englischsprachigen Raum hat dagegen genau diese Fragen der multimodalen 
Phänomene als solche eingehender behandelt, mit detaillierten Vorschlägen für 
die Binnenstruktur diverser Zeichenmodalitäten. Da die Theorie sozial orientiert 
ist, ist es für natürlich angesehen worden, neben den sprachlichen Phänomenen 
auch multimodale Formen zu untersuchen. Sprachgebrauch, und damit multi- 
modale Kommunikation im Allgemeinen, ist als Reflexion, Träger und Gestalter 
sozialer Konfigurationen zu sehen. Außerdem hat dieser Ansatz die wohl brei- 
teste multimodale Orientierung entwickelt - alle Kommunikationsformen wer- 
den unabhängig von ihrer Verwendung oder Nichtverwendung der verbalen 
Kommunikation als mögliche Untersuchungsgegenstand betrachtet, von der Ge- 
staltung von Lego-Bausteinen über Websites bis hin zu Innenarchitektur, Theater 
und Filmen u.v.m. Die Breite dieses Forschungsinteresses hat allerdings wahr- 
scheinlich zu der zunehmenden soziokulturellen Ausrichtung dieses Ansatzes 
wenigstens teilweise beigetragen, da nur wenige der angesprochenen Bereiche 
Zugang zu etablierten empirisch fundierten Analyseinstrumentarien haben. Eine 
Auswirkung dieser Entwicklung ist es dann, dass sich die multimodale Forschungs- 
tradition, wie sie von Kress, van Leeuwen und anderen unternommen wird, zu- 
nehmend von empirischen Anliegen entfernt und viele der Diskurspositionen 
und Argumentationsweisen der Kulturwissenschaften übernommen hat (z.B. Kress 
& van Leeuwen 2001; Kress 2010), obwohl auch diese Tradition aus der breit an- 
gelegten empirischen Tradition der Linguistik stammt. Diese Richtung ist dann 
die der Soziosemiotik (vgl. van Leeuwen 2005; Jewitt & Henriksen 2016). 

Die in diesem Rahmen erbrachten Analysevorschläge sind entsprechend ex- 
plorativ, und es ist nicht immer klar, ob sich die angewendeten Analysekatego- 
rien verlässlich einsetzen lassen. Dies ist in mehrerer Hinsicht problematisch. 
Wie Jewitt & Henrikson berichten: 


Like many other labour-intensive microanalytical approaches, this approach focuses its an- 
alytical gaze on a small collection of texts. [...] The focus on the sign maker, especially when 
working with texts alone, raises a number of issues including how intentionality can be 
evaluated and assigned, and the ‘right’ of interpretation. This approach is inevitably risky 
- in that everything hinges on how convincing the reader finds the analytical abstraction 
from the concrete text to the social. (Jewitt & Henrikson 2016: 162) 


Jewitt und Henrikson sehen die Rolle der Soziosemiotik folglich darin, Ideen her- 
vorzubringen, die durch größere Studien und unterschiedliche Ansätze weiter- 
entwickelt werden sollten. Der Schritt zu größeren Studien auf der Grundlage von 
eher explorativen Analysekategorien ist jedoch alles andere als einfach. 
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Darüber hinaus gibt es für viele dieser Zielbereiche der multimodalen Ana- 
lyse bereits starke kulturelle und hermeneutische Traditionen: So ist beispiels- 
weise der Film seit langem ein Gegenstand kultureller, gesellschaftspolitischer 
und literarischer Interpretation, das Theater wird in den Performance Studies an- 
gesprochen, Musik in der Musikwissenschaft, Comics und Graphic Novels wer- 
den primär als literarische Gattungen und mit in der Literatur- und Erzähltheorie 
verankerten Methoden angegangen, und so weiter. Es ist oft recht unklar, wie die 
mikroanalytischen Beschreibungen einzelner ‚Texte‘, die im sozial-semiotischen 
Rahmen als Untersuchungsgegenstände genommen werden, mit denen eher her- 
meneutischen Diskussionen kommunizieren sollen. Wie Ledin & Machin (2017) 
anmerken, ist die Antwort auf diese Situation allzu oft einfach, sich nicht mitdem 
bestehenden Werk auseinanderzusetzen. Aber auch signifikante ‚interne‘ theo- 
retische Verschiebungen sind durch diese Tendenz hervorgerufen worden. Was 
sich gegenwärtig innerhalb der Sozialsemiotik abspielt, erinnert häufig an die 
klassische Zwei-Kulturen-Debatte von Snow (2001 [1959]), bei der auf der Grund- 
lage von Methoden und Forschungsfragen eine unüberwindbare wissenschaftsi- 
deologische Trennung in Wissensbereiche vorgenommen wird, mit der Empirie 
auf der einen Seite und der Hermeneutik (und zunehmend auch der Sozialsemi- 
otik) auf der anderen. 

Wir halten dies sowohl für Ansätze zum linguistischen Sprachgebrauch als 
auch für multimodale Kommunikation im Allgemeinen für wenig hilfreich. Gene- 
rell gilt, dass die möglichen Aussagen umso begrenzter und schwächer werden, 
jeschwächer der Rückbezug auf Methoden ist, die es erlauben, größere Textmen- 
gen zu untersuchen. Können wir Muster finden, die wir auf der Grundlage punk- 
tueller Analysen erkennen können, die aber mit transtextuellen Eigenschaften 
korrelieren? Und weiter bis hin zu sozialen Konfigurationen? Und, für die breitere 
Multimodalität kritisch, sogar bis hin zu anderen Disziplinen? Als eine Strategie 
sowohl zur Überwindung dieser Fragmentierung als auch zur Wiedergewinnung 
eines produktiveren Austauschs zwischen Multimodalitätsforschung und lingu- 
istischer Theoriebildung legt der gegenwärtige Stand der Technik in der Multi- 
modalitätsforschung nahe, dass eine Neuverpflichtung auf empirische Methoden 
vorteilhaft wäre (für eine ausführlichere Diskussion vgl. Bateman 2019). Dies be- 
nötigt nicht nur groß angelegte korpusbasierte Studien, sondern auch kontrol- 
lierte experimentelle Versuche, um die Kategorien für solche größeren Studien 
vorab zu bestimmen und ihre Relevanz für den Verstehensprozess zu überprüfen 
bzw. validieren. Dies ist bereits für reine sprachwissenschaftliche Forschung an- 
erkannt, wie z.B. Gries, Hampe & Schönefeld beobachten: 


not all kinds of corpus-based evidence are equally well-suited to the purposes to which they 
are commonly applied. Ideally, therefore, the results of different methodologies should be 
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brought to bear on our claims and generalisations such that, for example, corpus-based 
results should be corroborated by experimenting. (Gries, Hampe & Schönefeld 2005: 636) 


Es kann zwar für einige Phänomene mehrere mögliche Beschreibungen oder Be- 
rechnungsweisen, die von der Korpusforschung unterstützt werden, geben - wel- 
che aber davon auch aus der Perspektive der Sprachverarbeitung und -produk- 
tion angemessen sind, kann nur durch entsprechende Experimente ermittelt 
werden. Dies wird noch stärker für die empirische Multimodalitätsforschung gel- 
ten. 

Ein wesentlicher Bestandteil der nötigen Brücke zwischen qualitativen Inter- 
pretationen einerseits und empirischen Arbeiten andererseits sehen wir in der 
systematischen Anwendung bestimmter sprachwissenschaftlicher Begrifflich- 
keiten, die bei entsprechender Erweiterung auch für die Strukturierung multimo- 
daler Analysen als vorteilhaft erscheinen. Wir argumentierten, dass vor allem Be- 
griffe aus der Diskurs- und Textanalyse für diese Aufgabe am effektivsten sind 
und sich als unabdingbar für die empirische Auseinandersetzung mit einem brei- 
ten Spektrum multimodaler Kommunikation erweisen. In diesem Beitrag stellen 
wir einige unserer jüngsten Arbeiten vor, um eine besondere Perspektive darauf 
zu eröffnen, wie die Multimodalitätsforschung im Allgemeinen zusammen mit 
empirischen Arbeiten betrieben werden kann. Diese Perspektive betrachtet Mul- 
timodalität als ein allgemeines, für alle Arten von Kommunikation und Textuali- 
tät relevantes Phänomen, dasin einer breiten sozialen, qualitativen Orientierung 
verankert ist, wie sie in Systemisch-Funktionalen und soziosemiotischen Ansät- 
zen angenommen wird, dann aber durch die Anwendung empirischer Methoden, 
sowohl experimenteller als auch korpusorientierter, enger spezifiziert bzw. ‚tri- 
anguliert‘ werden kann und soll. 


2 Ein allgemeines Modell der multimodalen 
Semiotik 


Die wohl größte Herausforderung für die Entwicklung von Positionen dieser Art 
besteht darin, empirische Forschung zu ermöglichen, die einen angemessenen 
Beitrag zur Theorieentwicklung und zur motivierten Anwendung dieser Theorie 
leisten kann. Dafür ist eine viel systematischere theoretische Beschreibung der 
unterschiedlichen Ausdrucksformen, die multimodale Phänomene hervorrufen, 
erforderlich. Um dieser Anforderung gerecht zu werden, haben wir in den letzten 
10 Jahren gemeinsam mit mehreren Kolleg*innen ein detailliertes abstraktes Mo- 
dell der Multimodalität entwickelt. Dieses Modell ist sowohl semiotisch als auch 
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diskurstheoretisch motiviert, und ist zudem auch explizit darauf ausgerichtet, 
empirische Forschung im linguistischen Sinne zu unterstützen und voranzutrei- 
ben (vgl. Bateman 2016; Wildfeuer, Bateman & Hiippala 2020). Das Modell ist in 
dem Sinne abstrakt, dass es ein Raster für alle möglichen multimodalen Kommu- 
nikationsformen anbieten soll. 

Das Modell baut aufeiner grundlegenden Definition des Begriffs der Zeichen- 
modalität und seiner Einbettung in eine allgemeine Perspektive auf menschliche 
Kommunikation auf. Die Hauptfunktion unserer Definition ist es, alle Fragen der 
Existenz und der Differenzierung von Zeichenmodalitäten nicht aus dem alltäg- 
lichen Sprachgebrauch, sondern vielmehr als Ergebnis empirischer Forschung zu 
beantworten. Das heißt konkret, dass wir nicht von ‚Bild‘ (oder sogar von ‚Text‘) 
reden, als ob wir bereits wüssten, dass diese Termini problemlos Zeichenmodali- 
täten identifizieren. Um als Zeichenmodalität zu gelten, müssen vorkommende 
Untersuchungsgegenstände gegenüber unserer Definition geprüft werden. Dies 
kann nur empirisch erfolgen, indem wir materielle Regelmäßigkeiten bei einem 
Untersuchungsgegenstand feststellen, die sich dann durch den Einsatz unseres 
Modells erklären lassen. Bis wir diese Absicherung haben, ist die Annahme einer 
Zeichenmodalität in einer Beschreibung immer als Hypothese zu verstehen. Da- 
mit schlagen wir eine Brücke zwischen unseren alltäglichen Ausgangspunkten 
und immer feineren theoretisch und empirisch motivierten Ausdifferenzierun- 
gen. Zugleich wird die häufig anzutreffende Annahme, dass wir bereits ‚wissen‘, 
welche Zeichenmodalitäten in einem Artefakt oder einer Performance am Werk 
sind - z.B. Text, Bild, Farbe, Typographie, Musik usw. — werden explizit als zu 
verfrüht abgelehnt. Genau deswegen ist eine trennschärfere Definition von Zei- 
chenmodalität unabdingbar. 

Ein zentraler Teil unserer Definition ist, dass jede Zeichenmodalität notwen- 
digerweise immer in einer Materialität verankert ist, die von der Gemeinschaft 
der Nutzer*innen, die sich mit dieser Zeichenmodalität beschäftigen, verwendet 
wird. Materialien, die in dieser Art verwendet werden können, sind äußerst viel- 
fältig, erfordern aber mindestens, dass sie ausreichend ‚kontrollierbar‘ sind, um 
zielgerichtete Artikulationen zuzulassen - sonst wäre es für eine Gemeinschaft 
von Nutzer*innen nicht möglich, sie als materielle Träger ‚semiotisch aufgelade- 
ner‘ Unterscheidungen zu verwenden. Dies umfasst sowohl körperliche Fähigkei- 
ten wie die Verwendung des menschlichen Sprechapparats zur Lautproduktion 
sowie die Verwendung der Körpermuskulatur zur Produktion von Gestik, Mimik 
und Körperhaltungen, als auch externalisierte Darstellungen, möglicherweise 
unterstützt durch Technologie, wie Zeichnung, Druck, Film, computergestützte 
Interaktion und so weiter. Wir nehmen Canvas als allgemeinen Terminus an, der 
all diese Materialitäten umfasst, wenn man sie speziell aus der Perspektive ihrer 
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Verwendung für Kommunikation innerhalb einer spezifischen Zeichenmodalität 
betrachtet. Canvases bestimmter semiotischer Modi können mehrere Sinneska- 
näle einbeziehen bzw. auf diese zurückgreifen und können daher bereits über 
einzelne Sinnesmodalitäten hinweg operieren, obwohl sie immer noch einzelne 
semiotische Modi vertreten. Die Materialität bildet somit die erste von drei grund- 
legenden semiotischen ‚Schichten‘, die definitorisch zu unserem Begriff einer 
Zeichenmodalität gehören. 

In jeder Zeichenmodalität wird dann die Materie zwecks Bedeutungskonsti- 
tution geformt. Die Definition dieser Formen und ihrer Aufbaumechanismen 
(analog dem Begriff einer ‚Grammatik‘) bilden eine zweite, abstraktere semioti- 
sche Schicht der expressiven ‚Form‘. Unterschiedliche Disziplinen haben bezüg- 
lich ihrer eigenen Untersuchungsgegenstände verschiedene Benennungen für 
diese Ebene. Sie ist jedoch immer dabei, wenn eine konkrete Ausdrucksform - 
wie Sprache, Film, bildende Kunst usw. - behandelt wird. Semiotisch gesehen 
handelt es sich hier um die Hjelmslevsche ‚Form des Ausdrucks‘-Ebene, die wir 
normalerweise auch mit Hilfe paradigmatischer und syntagmatischer Beschrei- 
bungsachsen spezifizieren. Etwas weniger formal sprechen wir in Anlehnung an 
die Filmtheorie von den ‚technischen Details‘ bzw. ‚Merkmalen‘ einer Zeichen- 
modalität. 

Schließlich kommt eine weitere, noch abstraktere semiotische Schicht dazu 
— die Diskurssemantik. Anders als bei der deutschsprachigen Verwendung von 
‚Diskurs‘ handelt es sich hier nicht um eine transtextuelle Beschreibung, sondern 
um eine dynamische Betrachtung des Bedeutungsaufbaus jedes einzelnen in- 
stanziierten Textes. Die Aufgabe der Diskurssemantik innerhalb einer beliebigen 
Zeichenmodalität besteht darin, bestimmte Bereitstellungen (zweite Schicht) von 
‚semiotisch aufgeladenem‘ Material (erste Schicht) mit ihren Nutzungskontexten 
und den kommunikativen Zwecken, die sie aufnehmen können, in Beziehung zu 
setzen. Also: Die Diskurssemantik einer Zeichenmodalität stellt die Interpretati- 
onsmechanismen bereit, die notwendig sind, um die in jeder Zeichenmodalität 
unterschiedenen besonderen Formen auf ihre Nutzungskontexte zu beziehen 
und das beabsichtigte Deutungsspektrum dieser Formen abzugrenzen. Solche In- 
terpretationen können in Bezug darauf, wie eng sie begrenzt sein sollen, variie- 
ren und reichen von sehr spezifischen bis hin zu eher abstrakten ‚Richtlinien‘ für 
die Interpretationsbildung. 

Die drei miteinander verknüpften Schichten einer Zeichenmodalität sind un- 
ten in Abbildung 1 dargestellt. Alle drei Komponenten sind zwingend erforder- 
lich, um von einer Zeichenmodalität reden zu können. Dadurch wird die Trenn- 
schärfe zwischen Zeichenmodalitäten und semiotisch interpretierbaren Formen 
im Allgemeinen wesentlich erhöht. Wenn überzeugende Ausformulierungen der 
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drei Schichten nicht gefunden werden können, spricht dies gegen die Annahme 
einer Zeichenmodalität. Zeichenmodalitäten können unter sich in Bezug auf den 
Umfang der Leistung, den sie mit ihrer Diskurssemantik erbringen, unterschied- 
lich aufgestellt sein, aber die Anwesenheit irgendwelcher Interpretationsrichtun- 
gen ist als definitorisch anzusehen. Das heißt: ohne Diskurssemantik gibt es kei- 
ne Zeichenmodalitat. 

Welche Zeichenmodalitäten in einem Artefakt oder einer Performance einge- 
setzt werden, hängt von soziokulturellen Faktoren ab: Bestimmte Kulturen wer- 
den es ‚gewohnt sein‘, bestimmte Zeichenmodalitäten statt anderer miteinander 
zu kombinieren, und sie werden besondere institutionelle, technologische und 
materielle Kontexte entwickelt haben, innerhalb derer die Kommunikation unter 
Verwendung dieser Zeichenmodalität stattfindet (vgl. Posner 1991). Wir definie- 
ren diese Konfigurationen formell als Medien. Unter dieser Sichtweise wird ein 
Medium am besten als ein historisch stabilisierter Ort für den Einsatz und die Ver- 
breitung einer gewissen Auswahl an Zeichenmodalitäten zur Erreichung eines 
sozial eingeschränkten und einschränkenden Spektrums an kommunikativen 
Zwecken gesehen. Zum Beispiel: Bücher sind ein Medium, das traditionell zumin- 
dest Regelmäßigkeiten, die wir einer angenommenen Zeichenmodalität des ge- 
schriebenen Textes zuschreiben können, und Regelmäßigkeiten, die die Annah- 
me einer Zeichenmodalität des Seitenlayouts plausibel macht, aufweisen. Als Ab- 
kürzung können wir dann diese Zeichenmodalitäten hypothetisch für erklärende 
Beschreibungen des Artefakts aufnehmen: wenn wir einem Buch begegnen, 
dann nehmen wir an, dass bestimmte Zeichenmodalitäten wahrscheinlich sind, 
andere weniger wahrscheinlich und andere überhaupt nicht möglich sind. Empi- 
risch lässt sich dies in drei Untersuchungsstufen auseinanderziehen: (i) Hypo- 
thesen darüber, welche Zeichenmodalitäten für welche materielle Regelmäßig- 
keiten zuständig sind, (ii) Hypothesen darüber, welche angenommenen Zeichen- 
modalitäten durch das Medium kombiniert werden, und (iii) Hypothesen bezüg- 
lich der kommunikativen Zwecke, die gerade angestrebt werden. Bisherige Un- 
klarheiten bzw. Schwierigkeiten bei der Einordnung von Zeichenmodalitäten, 
Textsorten, Medien usw. sind meistens darauf zurückzuführen, dass diese drei 
Aspekte nicht adäquat voneinander differenziert worden sind. Standardbenen- 
nungen von Textsorten, Genres, Medien u.a. bedienen sich ziemlich frei aus Kom- 
binationen dieser Bereiche, was dann leicht für Verwirrung sorgt. 
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Abbildung 1: Oben: Abstrakte Definition einer Zeichenmodalität. Alle Zeichenmodalitäten kom- 
binieren drei semiotische ‚Schichten‘: materielles Substrat, technische Merkmale (abgekürzt 
als ‚Form‘) und Diskurssemantik. Unten: Einbettung von Zeichenmodalitäten innerhalb eines 
Mediums und in Bezug auf Genre (vgl. Wildfeuer et al. 2020: 143, 152) 


Dieses Verhältnis zwischen Medien und Zeichenmodalitäten ist in Abbildung 1 
grafisch erläutert; in der suggestiven Formulierung von Winkler (2008: 213) betrach- 
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ten wir folglich jedes Medium als ein Biotop für Semiose, weil diverse Zeichenmo- 
dalitäten in enge Berührung miteinander gebracht werden. Medien stehen dann 
als potenzielle Realisierungen oder Ausdrucksstrategien für allgemeine kommu- 
nikative Zwecke, die als Genres bezeichnet werden. So kann z.B. das Genre einer 
Erzählung durch die Auswahl eines überwiegend geschriebenen Mediums wie ei- 
nes Buches oder ebenso als statische visuelle Erzählung im Medium des Comics 
oder als dynamische visuelle Erzählung im Medium des Films realisiert werden. 
Die Synchronisation verschiedener Zeichenmodalitäten, die zur Erreichung eines 
kommunikativen Zwecks beitragen, wird durch Beziehungen zwischen den ver- 
schiedenen Diskurssemantiken verwaltet, die von den beitragenden Zeichenmo- 
dalitäten bereitgestellt werden. Eine ausführlichere Einführung in diese Ausdif- 
ferenzierung der Grundbegriffe der Multimodalität ist Wildfeuer et al. (2020) zu 
entnehmen. 


3 Mehrfache Triangulationen und die Leiter der 
Abstraktion 


Obwohl das im letzten Abschnitt vorgestellte Modell semiotisch gut motiviert ist 
und zweifellos nützlich ist als allgemeines organisierendes Raster für die Erfor- 
schung beliebiger multimodaler Kommunikationssituationen, stellt die Überbrü- 
ckung der unterschiedlichen Abstraktionsebenen in diesem vielschichtigen Mo- 
dell doch eine methodische Herausforderung dar. Einerseits sind bei der Unter- 
suchung der multimodalen Kommunikation oft abstrakte soziokulturelle Fakto- 
ren involviert, die bei der Erprobung der Verarbeitung von Elementen der unte- 
ren wahrnehmungsnäheren Ebenen bestenfalls indirekt zugänglich sind. Bei- 
spiele dafür sind etwa konventionalisierte ästhetische Formen und soziopoliti- 
sche Konstellationen. Eine Reihe empirischer Evidenzen spricht zunehmend da- 
für, dass solche soziokulturellen Faktoren sogar stärkere Auswirkungen als un- 
tergeordnete Formelemente haben können, wenn die ästhetische Interpretation 
berücksichtigt wird (vgl. Siefkes & Arielli 2018; Van Hedger et al. 2019). Dies stellt 
eine erhebliche Herausforderung für die Forschung dar, weil bei der Durchfüh- 
rung von Experimenten eine angemessene Vielfalt soziokultureller Variablen 
und kontrollierte Wahrnehmungsstimuli zu kombinieren sind. Diese können 
nicht zum Zweck einer einfacheren Untersuchung ausgeklammert werden, ohne 
die Ergebnisse zu verzerren. 

Andererseits muss bei der empirischen Untersuchung darauf geachtet wer- 
den, dass Ergebnisse aus einem Bereich nicht verfrüht oder unangemessen in an- 
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dere tibertragen werden. Zum Beispiel kann aus der Tatsache, dass bestimmte 
empirische Ergebnisse bezüglich des Gesichtsausdrucks in Gemälden erzielt wur- 
den, nicht geschlossen werden, dass diese Ergebnisse fiir Filme oder Graphic No- 
vels gelten. Umgekehrt gibt es, nur weil eine bestimmte Modellierung der sequen- 
tiellen Interpretation fiir Graphic Novels abgeleitet und empirisch plausibilisiert 
wurde, keine Garantie dafiir, dass diese Modellierung auch fiir Filme oder andere 
Formen der sequentiellen Informationsdarstellung gilt. Ebenso lasst sich eine 
Modellierung der Funktionen von Seitenlayout und Komposition fiir Zeitungen 
nicht auf Graphic Novels übertragen, und so weiter. Solche Ergebnisse können 
als Hypothesen für die Organisation anderer Medien verwendet werden, müssen 
aber dennoch mit Vorsicht behandelt werden, bis die erforderlichen empirischen 
Untersuchungen durchgeführt worden sind. 

Die Notwendigkeit, unterschiedliche Herangehensweisen an die Untersu- 
chung multimodaler Texte zu kombinieren, ist daher offensichtlich. Wir halten 
esjedoch für unabdingbar, dass solche Trennungen auf einer grundlegenden me- 
thodologischen Ebene überwunden werden. Man kann sich vor Augen führen, 
dass die meisten Probleme der realen Welt sowieso zu komplex sind, um mit ein- 
zelnen Perspektiven oder Methoden angemessen angegangen zu werden (vgl. A- 
guado 2015: 214). Um robuste Methoden zu entwickeln, die die erforderliche Syn- 
these mehrerer Ansätze und Datenquellen in das Forschungsdesign einbeziehen, 
insbesondere wenn es um die Ästhetik und andere hermeneutische Interpretati- 
onsfragen geht, muss daher nach einer grundlegenden Lösung gesucht werden. 
Ein Ansatz, der verspricht, verschiedene Perspektiven und Dimensionen komple- 
xer Bedeutungs- und ästhetischer Interpretationsprozesse zu erfassen, ist der der 
Triangulation. 

Unter „Triangulation“ wird seit mehreren Jahrzehnten eine anerkannte Stra- 
tegie in den Sozial- und Sprachwissenschaften verstanden (z.B. Denzin 1970; 
Fine 1985; Mathison 1988; Baker & Egbert 2016), die aber immer noch zu selten 
angewandt wird, um komplexe Fragen der Ästhetik, des Bedeutungsverständnis- 
ses und der Interpretation multimodaler Artefakte und Performances zu untersu- 
chen. Die methodologische Anwendung des Fachterminus „Triangulation“ in der 
Forschung ist eine als metaphorische Erweiterung ihrer ursprünglichen Anwen- 
dung als Messmethode, bei der die Entfernung oder Position unbekannter Punkte 
in Bezug auf mehrere bereits bekannte Punkte und Entfernungen berechnet wer- 
den. Methodologisch ist Triangulation dabei als ein Mittel zur Überwindung von 
Schwächen gedacht, die jeder einzelnen angewandten Methode innewohnen 
können: Wenn man mit verschiedenen Methoden konvergierende Beweismittel 
(„converging evidence“) für eine bestimmte theoretische Modellierung eines Ge- 
genstandsbereichs liefern kann, stärkt dies die Beweisführung. Denzin (vgl. 1970: 
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301) legt eine viel zitierte Typologie von Triangulationsarten vor, darunter Da- 
tentriangulation, Forschertriangulation (engl. ‚intercoder reliability‘), Theorietri- 
angulation und Methodentriangulation. Von diesen ist die methodologische Tri- 
angulation wahrscheinlich die am häufigsten anzutreffende Form, da sie in den 
derzeit populären ‚gemischten Methoden‘-Analysestilen durchgeführt wird, die 
sowohl qualitative als auch quantitative Ansätze umfassen. 

Für unsere aktuelle Diskussion ist jedoch die disziplinäre Triangulation die 
relevanteste, aber auch die anspruchsvollste. Insbesondere in geisteswissen- 
schaftlichen Disziplinen wurde argumentiert, dass Ansichten über die Überwin- 
dung von Schwächen durch Triangulation unangemessen sind, da jede Disziplin 
als ‚vollständige‘ Antwort innerhalb ihres eigenen Diskursuniversums betrachtet 
werden kann. Dies erfordert, dass die Triangulation über Disziplinen hinweg eher 
im Sinne der Überwindung möglicher Lücken oder blinder Flecken in den Per- 
spektiven gesehen wird — das heißt die Triangulation liefert eher komplementäre 
Ansichten als eine Validierung (z.B. Überwindung von Messungenauigkeiten) 
oder Erweiterungen bereits kompatibler Ansichten (z.B. das Hinzufügen von 
Winkeln oder Abständen für einen weiteren Punkt, der sich noch im gleichen Ge- 
samtraum befindet) (vgl. Erzberger & Kelle 2003; Hammersley 2008). Dies wurde 
als ein besonders wichtiges Gegenmittel zu vielleicht einseitigen quantitativen 
Analysestilen vorgeschlagen (vgl. Janesick 1998: 53). Allerdings ist auch die Tri- 
angulation über verschiedene Akte der hermeneutischen Interpretation nicht 
einfach. In der Tat kann sie leicht als grundlegend fehlgeleiteter Versuch angese- 
hen werden, unvereinbare philosophische Perspektiven auf das Wesen von Wis- 
sen und Forschung zu kombinieren (vgl. Mathison 1988; Blaikie 1991). Auch 
wenn in diesem Fall der Ruf nach multi-, trans- oder pluridisziplinären Herange- 
hensweisen an komplexe soziale Phänomene mitschwingt, muss die Anwendung 
der Triangulation notwendigerweise auch Bedenken hinsichtlich des Reduktio- 
nismus und des mangelnden Bewusstseins aufwerfen, dass es die Disziplinen 
und ihre Weltsichten sind, die ihre Analyseobjekte überhaupt erst ins Leben ru- 
fen. Diese immer wiederkehrende Problematik ist dann stark philosophischer Na- 
tur, wie die Skepsis vieler Geisteswissenschaftler*innen zeigt — zum Beispiel als 
kritische Antwort auf Ansätze in den digitalen Geisteswissenschaften (vgl. Da 
2019). Subjektive Bedeutungsinterpretationen und ästhetische Haltungen wer- 
den häufig als unvereinbar mit verallgemeinerbaren, objektiven empirischen Be- 
legen interpretiert (vgl. Fish 1980), und infolgedessen lehnen Forscher*innen in 
eher interpretativen Bereichen nicht selten die Idee ab, dass empirische Studien 
über größere Datenmengen für ihre eigenen Anliegen und Forschungsfragen re- 
levant sein könnten. 
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Um diese Diskussion voranzubringen, stützt sich die hier vertretene Sicht- 
weise der disziplinären Triangulation insbesondere auf die Diskussion der ‚äs- 
thetischen Triangulation‘ von Smith (2012), die wiederum auf Flanagan (1992) 
aufbaut. Smith argumentiert, dass es für das Verständnis komplexer Artefakte, 
wie z.B. seines primären Beispiels Film, wesentlich ist, ganz unterschiedliche dis- 
ziplinäre Zugangsweisen zu kombinieren. Smith schlägt vor, dass ein Verständ- 
nis von Film (zumindest) neurologische Ansätze zur Funktionsweise des Gehirns 
bei der Beschäftigung mit Film, phänomenologische Darstellungen der filmi- 
schen Erfahrung und kognitiv-psychologische Darstellungen der funktionalen 
audiovisuellen Verarbeitung erfordert. Darüber hinaus wird dabei jeder Art von 
‚Reduktionismus‘ explizit verneint: kein Ansatz ist als ‚grundlegender‘ als irgend- 
ein anderer anzusehen. Die Beziehungen zwischen verschiedenen Arten der dis- 
ziplinären Darstellung werden stattdessen durch die Suche nach ‚Übersetzun- 
gen‘ oder Entsprechungen von Vorhersagen über die verschiedenen Bereiche 
hinweg verfolgt. Erklärungen und offene Fragen innerhalb einer Disziplin wer- 
den dann als strukturelle Konfigurationen angesehen, die mit ähnlichen struktu- 
rellen Beziehungen in anderen Disziplinen korrespondieren können (oder auch 
nicht). Eine Triangulation verschiedener Analyseergebnisse auf diese Weise ist 
dann in der Lage, Interdependenzen zwischen verschiedenen Aspekten des Prob- 
lems aufzudecken und inhärente Instabilitäten aufzuzeigen, die auftreten wür- 
den, wenn einzelne Ansätze auf Kosten anderer privilegiert wären. 

Erschwert wird diese Form der Triangulation allerdings dadurch, dass ästhe- 
tische oder soziopolitische Interpretationen auf höherer Ebene und Wahrneh- 
mungsdaten auf niedrigerer Ebene kaum direkt miteinander verbunden werden 
können. Daher fügen wir hier eine weitere vermittelnde Ebene hinzu in Form der 
Semiotik. Die semiotische Analyse mit Hilfe des oben eingeführten Zeichenmo- 
dalitätsmodells stellt eine zwischengeschaltete Ebene von ‚Textstrukturen‘ zur 
Verfügung, die es erlaubt, Bedingungen zu definieren, unter denen bestimmte 
Effekte einer Ebene mit Effekten auf anderen Ebenen korrelieren (oder auch 
nicht). Diese vermittelnde Ebene ist dann zwischen ästhetischen Fragen und Be- 
schreibungen von Materialeigenschaften auf niedriger Ebene angesiedelt. Dies 
bietet eine Möglichkeit, divergierende Perspektiven in Einklang zu bringen und 
gleichzeitig produktive Beziehungen zwischen diversen Dimensionen der multi- 
modalen Kommunikation herzustellen. Damit wird eine Tür für die Durchfüh- 
rung von Forschung geöffnet, die auf nachvollziehbare Weise empirische, her- 
meneutische, interpretative und semiotische Beschreibungsansätze kombiniert. 

Diese Triangulationsstrategie wird in Abbildung 2 grafisch verdeutlicht. Wie 
hier gezeigt, baut die Triangulation auf der Synthese von drei prinzipiellen Ana- 
lysebereichen auf: (i) hermeneutische Beschreibung in soziokulturellen, ästhe- 
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tisch orientierten Studien; (ii) korpusbasierte, funktionale semiotische Analyse 
in Untersuchungen der multimodalen Semiotik; und (iii) experimentelle Ergeb- 
nisse in kognitiven Studien. Methoden wie Korpusstudien und experimentelle 
Methoden sind Techniken, die die Entwicklung eines überprüfbaren Methoden- 
arsenals vorantreiben, das zu intersubjektiv gültigen Ergebnissen führt, und die 
Kritik, Verfeinerung und Ersetzung bestehender Begriffe und Theorien fördern. 
Dies funktioniert am besten, wenn es bereits einen Bereich etablierter und allge- 
mein anerkannter Methoden als Ausgangspunkt methodischer Weiterentwick- 
lungen gibt. In vielen Bereichen der Multimodalität gibt es solche Methoden je- 
doch nicht. Hier wenden wir unser eingeführtes semiotisches Modell direkt an 
und erweitern die Triangulation, um auch über verschiedene Ebenen der semio- 
tischen Abstraktion zu verfügen. Eine solche Triangulation setzt nicht nur sozio- 
kulturelle Studien, Semiotik und Kognitionswissenschaften in Bezug zueinan- 
der, sondern auch verschiedene Analyseebenen, die technische Merkmale, Dis- 
kurssemantik, narrative Interpretationen, Ästhetik, Affekt und Fragen der Unter- 
schiede verschiedener Genres und Medien umfassen. Damit liefert sie genau jene 
‚Fixpunkte‘, die notwendig sind, um mit der Modellierung neuer multimodaler 
Bereiche zu beginnen und die Analyse von etablierten Bereichen zu verbessern. 
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Abbildung 2: Triangulation von Disziplinen zur Behandlung von Problemen der Ästhetik und 
der Bedeutungsinterpretation 
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Sowohl in unseren korpusbasierten als auch in unseren experimentellen Unter- 
suchungen und Rezeptionsstudien beziehen wir die verschiedenen Beschreibungs- 
ebenen in ähnlicher Weise ein. Die in der multimodalen, linguistisch inspirierten 
Semiotik verankerten Ansätze werden übernommen, um eine methodische Leiter 
zur Verbindung von Abstraktionsebenen zu konstruieren, die sonst einfach zu 
weit voneinander entfernt wären, um sinnvoll in Beziehung gesetzt zu werden. 
Auf den abstrakteren Ebenen werden hypothetische semiotische Strukturen ent- 
worfen, die auf semantische Verbindungen zwischen Elementen auf den unteren 
Ebenen zurückgreifen, die sowohl für die Wahrnehmung als auch für das Ver- 
ständnis der Interpretationen relevant sein sollten. Auf den weniger abstrakten 
Ebenen werden diese Verknüpfungen dazu verwendet, eine Vorauswahl an kon- 
kret zu untersuchenden Varianten zu treffen, indem die experimentellen Variab- 
len eingeschränkt werden. Dadurch wird eine Abstraktionsleiter zwischen ästhe- 
tischen und anderen hermeneutischen Fragen einerseits und kontrollierten Ex- 
perimentierstimuli und erwarteten Verteilungen von Phänomenen in größeren 
Datenkorpora andererseits hergestellt. 


4 Empirische Projekte: eine selektive Auswahl 


In den letzten Jahren haben wir zusammen mit Kolleg*innen aus unterschiedli- 
chen Disziplinen eine Reihe theoretischer sowie empirischer Studien durchge- 
führt, die auf die Möglichkeit der Triangulation zwischen Empirie und qualitati- 
ver Interpretation fokussieren. Im weiteren Verlauf dieses Beitrags konzentrieren 
wir uns nun auf diese Untersuchungen. Konkret stellen wir vier Beispiele vor, die 
sich auf die Triangulation stützen, um eine Synthese aus stilistischer Beschrei- 
bung, semiotischer Analyse und empirischen Erkenntnissen zu schaffen. Dabei 
wird unser erweiterter Ansatz zur Multimodalität eingesetzt, in dem weitgehend 
linguistische Methoden und Begrifflichkeiten aus der Diskursanalyse als Vorbild 
dienen. Wir charakterisieren die Sichtweise, die wir mit Hilfe der empirischen 
Analyse im Kontext der Triangulation einnehmen, sowohl theoretisch als auch 
methodisch, und zeigen, wie die Übernahme sprachwissenschaftlicher Begriff- 
lichkeiten dazu geführt hat, die Funktionsweise unterschiedlicher multimodaler 
Artefakttypen näher betrachten zu können. Obwohl wir uns mit korpus- und ex- 
perimentell-basierten Studien gleichermaßen beschäftigen, fokussieren wir im 
vorliegenden Beitrag lediglich auf experimentelle Studien. Für jedes Beispiel be- 
schreiben wir dementsprechend die experimentellen Methoden und das Design 
kurz und fassen dann die Hauptergebnisse bezüglich der Triangulation zusam- 
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men; die vollständigen Details der vorgestellten Studien sind in den referierten 
Artikeln dargestellt. 


4.1 Eyetracking in Comics und Graphic Novels: 
die Organisation des Diskurses 


In unseren ersten zwei Beispielen beschäftigen wir uns mit den Medien Comic 
und Graphic Novel. Es wird angenommen, dass diese beiden Medien die Mehr- 
zahl ihrer beteiligten Zeichenmodalitäten gemeinsam haben. Die Medien selbst 
sind äußerst komplex und weisen eine breite Forschungsliteratur auf. Diese Lite- 
ratur war aber bis vor kurzem von literarischen und mediengeschichtlichen An- 
sätzen geprägt (vgl. Mikkonen 2017; Aldama 2018; Packard et al. 2019 u.v.a). Dazu 
hat Cohn (2014) eine kontrovers diskutierte Kritik gebracht, in der er die weitge- 
hende Fehlanzeige an empirischer Comicforschung bemängelte. Diese Situation 
wird inzwischen explizit angegangen (vgl. Dunst et al. 2018) und unsere hier be- 
richteten Studien sind auch im Kontext dieses Wandels zu sehen. 

Bei genaueren Untersuchungen der semiotischen Ressourcen, die in den Me- 
dien Comic und Graphic Novel eingesetzt werden, wird immer deutlicher, dass 
die bisher übliche Aufmerksamkeit für ‚Bild‘ und ‚Text‘ als die relevanten Zei- 
chenmodalitäten bei weitem nicht ausreicht. Unserer Erfahrung nach führt eine 
genauere Betrachtung zu nützlicheren Beschreibungen als voreilige Annahmen 
bezüglich der angewandten Modi. Zur konkreten Veranschaulichung ziehen wir 
in unseren Beispielen Diskursanalysen heran, die jenseits einer Bild-Sprache- 
Trennung operieren. Ziel wird es sein, aufzuzeigen, wie wir das volle Spektrum 
von empirisch durchgeführten Experimenten bis hin zu möglichen Auswirkun- 
gen bei den Interpretationen, inklusive Überlegungen zu Narrativ und Gattun- 
gen, produktiv in die Diskussion einbringen können. 

Als Ausgangspunkt benötigen wir plausible Hypothesen bezüglich der Wir- 
kung der untersuchten Medien durch die angewandten Zeichenmodalitäten. In 
Frage kommende Modalitätsmöglichkeiten wären aus der Schriftsprache, Seiten- 
layout, schematisierter piktographischer Darstellungen, Typografie usw. zu er- 
warten. Auf noch höherer Ebene kommen dann Konventionen bestimmter Co- 
mics-Stile und -Gattungen hinzu, die auch Auswirkungen auf experimentelle Fr- 
gebnisse haben können. Für narrative Gattungen spielen insbesondere Charak- 
tere, Objekte und Umstände, sowie Sequenzen von Ereignissen diverser Art eine 
wichtige Rolle. Um darzustellen, wie solche narrativen Einheiten multimodal 
aufgeführt werden, brauchen wir entsprechende multimodale diskursanalyti- 
sche Beschreibungen. Hier bietet sich das auf multimodale Kohäsion abzielende 
semantische Diskursmodell von Tseng (2013) an. Dieses Modell stellt einen dif- 
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ferenzierten analytischen Rahmen zur Verfügung, um zu untersuchen, wie ein- 
zelne Charaktere, Objekte und Umstände in verbalen, visuellen und akustischen 
Modalitäten durch die Rezipienten identifiziert und nachverfolgt werden kön- 
nen. Um aber sicher zu gehen, dass eine semiotische Beschreibung mit Hilfe der 
Kohäsionsanalyse tatsächlich für die Zeichenmodalitäten des Mediums relevant 
ist, müssen wir zeigen können, dass Variationen in der kohäsiven Organisation 
eines Textes (auch multimodal) mit messbaren Unterschieden in Wahrnehmung 
und Interpretation korrelieren. Erst dann hätten wir empirischen Belege für eine 
Ausformulierung unserer Diskurssemantik mit Hilfe von Kohäsionsanalysen. 

In Tseng, Laubrock & Pflaeging (2018) berichten wir über eine Versuchsreihe 
zu Comics und Graphic Novels mit genau diesem Ziel. Als experimentelles Mate- 
rial nahmen wir die ersten Seiten von Paul Karasik und David Mazzuchellis 
(2004) Graphic-Novel-Adaption von Paul Austers City of Glass (1985). Um Varia- 
tionen der Wahrnehmung festzustellen, verwendeten wir Eyetracking-Techniken 
und für Variationen in Interpretationen Fragebögen. Die kohäsive Struktur in City 
of Glass zeigt einen markanten Charakter, der eine Vielzahl von Aktionstypen 
auslöst, die von dynamischem Engagement, Verhalten, Interaktionen mit ande- 
ren Charakteren und Gegenständen bis hin zum Ausdruck von Gefühlen reichen 
(Tseng & Bateman 2018). Um diese Diskursanalyse und die vorgeschlagenen In- 
terpretationen empirisch zu evaluieren, manipulierten wir eine Reihe kohäsiver 
Ketten in der Graphic Novel, indem wir alle Spuren der visuellen Repräsentation 
des Charakters durch Leere oder neutrale Gegenstände ersetzten, während wir 
die zahlreichen sprachbasierten Kohäsionsbindungen auf ihn intakt ließen. Da- 
mit sollte getestet werden, welche Auswirkungen das Vorhandensein von visuel- 
len Zeichensignalen auf das narrative Verarbeitungsverhalten und damit auf das 
Verständnis haben könnte. Wir stellten die Hypothese auf, dass eine solche Ma- 
nipulation der multimodalen kohäsiven Ketten messbare Auswirkungen haben 
würde. 

Unsere Ergebnisse zeigten in der Tat signifikante Unterschiede im Blickver- 
halten der Teilnehmer*innen je nachdem, ob sie das Original oder die manipu- 
lierte Version gelesen hatten. Damit kann als erwiesen gelten, dass Variationen 
in der Kohäsion auch mit Variationen im Rezeptionsverhalten zusammenfallen. 
Insbesondere zeigte sich, dass die Manipulation einen zuverlässigen Effekt auf 
die Betrachtungszeiten der Panels der Graphic Novel hatte: Die Betrachtungszei- 
ten im Original waren im Durchschnitt 138 ms signifikant länger als im bearbei- 
teten Zustand. Wir interpretierten dies so, dass die Betrachter*innen erhöhten 
kognitiven Aufwand betreiben, wenn sie narrativ-relevante visuelle Information 
haben. Dies unterstützt weiter die Annahme, dass die Kohäsion eine funktionelle 
Rolle beim Verstehen des multimodalen Textes aufnimmt. Die Daten des Frage- 
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bogens führten zu ähnlichen Schlussfolgerungen. Dies legt nahe, dass die Frage, 
ob eine visuell-verbale, cross-modale Kohäsionskette konstruiert wird oder nicht, 
Auswirkungen auf das Leseverhalten der Teilnehmer*innen hat. Die Teilneh- 
mer*innen schienen die Hinweise auf eine visuell dargestellte Figur in den Pa- 
nels zu verfolgen, wenn diese Figur innerhalb der gleichen kohäsiven Kette auf- 
fällig und kohärent mit dem Text verbunden war. Dies unterstützt dann weiter 
die Untersuchung von Kohäsion mit dem Ziel, Vorhersagen darüber zu treffen 
und zu testen, welche technischen Merkmale in einem Artefakt oder einer Auf- 
führung die Interpretation beeinflussen und wann. Für produktive experimen- 
telle Stimuli, die zwecks Variabilität in der Rezeption und Interpretation einge- 
setzt werden sollten, scheint ihre kohäsive Zuordnung sicherlich wichtig zu sein. 


4.2 Eyetracking in Comics und Graphic Novels: 
Seitenaufbau/Komposition 


Im zweiten Beispiel erweitern wir die untersuchten Phänomene, um möglichen 
narrativen Auswirkungen von der Seitengestaltung (oder Layout) in Comics und 
Graphic Novels näher zu kommen. Seitengestaltung wird im Allgemeinen in der 
Comicforschung als eine höchst variable und kreativ eingesetzte Gestaltungsdi- 
mension angesehen, die sich kaum empirisch untersuchen lässt. Seitengestalte- 
rische Unterscheidungen werden trotzdem in der Forschungsliteratur häufig mit 
Auswirkungen für die Narrative assoziiert. Wenn aber diese Auswirkungen sys- 
tematisch sind, sollte es möglich sein, Layout als operative Zeichenmodalität in 
diesen Medien zu identifizieren und spezifizieren. Als Vorarbeit haben wir in 
Bateman et al. (2017) eine detaillierte Klassifikation möglicher Layout-Strategien 
in Comics entworfen, die selbst auf der Grundlage einer Korpusanalyse abgeleitet 
wurde. Korpusanalyse ist hier in dem Sinne gemeint, dass eine etwas größere 
Auswahl von Comicseiten (d.h., mehrere hundert Seiten) von mehreren For- 
scher*innen auf mögliche Gestaltungsprinzipien untersucht wurden; diese Prin- 
zipien wurden wiederholt verglichen und verfeinert, bis ein weitgehend stabiler 
Satz übrig zu bleiben schien. Die Klassifikation diente dann als mögliche para- 
digmatische Achse der Form-Ebene einer entsprechenden Zeichenmodalität. 
Wenn das so ist, muss es möglich sein, empirisch zu belegen, dass die Auswahl 
kontrastierender Strategien aus dieser Klassifikation erstens zu kontrastierenden 
Interpretationen auf der höheren narrativen Ebene und zweitens zu systematisch 
unterschiedlichem Verhalten bei den Rezipient*innen führen soll. Um diese Fra- 
gen experimentell nachzugehen, haben wir wiederum Eyetracking-Techniken 
angewandt. 
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In Bateman et al. (2018) beschreiben wir ein Experiment dieser Art, in dem 
ein ziemlich subtiler Kontrast aus unserer Klassifikation von Layout-Strategien 
untersucht wird. Dieser Kontrast entsteht dadurch, dass der Rahmen eines Panels 
(oder mehrerer) auf einer Seite entfernt wird und die Farbgebung seines Hinter- 
grunds als Hintergrund für die ganze Seite ausgeweitet wird, vor dem die nicht 
veränderten Panels mit ihren Rahmen stehen. Da die Seite dann den Anschein 
hat, dass das sich ausbreitende Panel in gewisser Weise in einer sonst durch die 
übrigen Panels auf der Seite gebildeten gitterartigen Struktur fehlt, entsteht visu- 
ell eine Lücke oder ‚Gap‘. Die Diskussion solcher Seitenlayouts in der eher her- 
meneutischen Literatur führt häufig zu der Vermutung, dass die Einführung von 
Lücken und abgeschnittenen Panels erzählerische Konsequenzen haben kann, da 
die Panels gruppiert und Unterscheidungen zwischen Vorder- und Hintergrund 
eingeführt werden. Eine systematische empirische Überprüfung solcher Effekte 
wurde jedoch bisher nicht durchgeführt, vermutlich weil es ohne stärkeres semi- 
otisches Gerüst methodologisch schwierig ist, verlässlich festzustellen, ob solche 
Layouts die Rezeption beeinflussen oder nicht. 

Um die Frage, ob dieser Kontrast zwischen dem ursprünglichen Layout und 
dem manipulierten Layout mit der Lücke als Beitrag zu einer Zeichenmodalität 
des Layouts in Comics dienen könnte, untersuchten wir die Auswirkungen des 
Kontrasts experimentell wie folgt. 12 Originalseiten aus Comics, die eindeutig die 
gewünschte Layout-Strategie aufwiesen, wurden aus unserem Korpus ausge- 
wählt. Alle Seiten waren dem Superhelden-Genre zuzuordnen und wurden seit 
dem Jahr 2000 veröffentlicht. Anschließend wurden 12 modifizierte Versionen 
dieser Originalseiten erstellt, bei denen der Hintergrund entfernt und ein Rah- 
men entsprechend der Seite um das zuvor ungerahmte Panel herum wieder ein- 
gefügt wurde. Von jedem Paar Original-/modifizierter Seiten war also nur ein Pa- 
nel betroffen; alle anderen Panels blieben unverändert. Durch diese Manipula- 
tion haben wir minimal kontrastierende Paare für das interessierende Layout- 
Merkmal produziert. Wenn dieser Kontrast für die Zeichenmodalität relevant ist, 
dann sollten die Rezipient*innen entsprechende Unterschiede in ihrem Verhal- 
ten und ihrer Interpretation aufweisen. 

Die Studie bestand dann aus zwei Teilen. Da wir insbesondere feststellen 
wollten, inwieweit die untersuchten Designvarianten mit abstrakteren Fragen 
der Erzählrezeption korreliert sein könnten, versuchten wir zunächst, die naiven 
Reaktionen der Leser*innen auf unsere Manipulationen unabhängig vom Blick- 
verfolgungsverhalten näher zu betrachten. Zu diesem Zweck baten wir Teilneh- 
mer*innen einer separaten Pilotstudie, die Paare von Original- und modifizierten 
Seiten zu betrachten und diese Paare nach potentiell erzählrelevanten Dimensi- 
onen (Sequentialität, Kausalität usw.) zu bewerten. Dann wurden im Eyetrack- 
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ing-Teil der Studie 60 Teilnehmer*innen gemischte Sammlungen von Original- 
und modifizierten Seiten gezeigt, wobei sie entweder die ursprüngliche oder die 
modifizierte Seite sahen, nie jedoch zwei Seiten aus demselben Kontrastpaar. Zur 
Auswertung der Blickverhaltensdaten wurde untersucht, ob die Modifikation als 
zuverlässiger Prädiktor für Variationen in der Betrachtungsdauer einzelner Pa- 
nels verwendet werden könnte. 

Die Ergebnisse waren zuerst gemischt. Einige manipulierten Seiten verur- 
sachten längere Betrachtungszeiten als die nicht manipulierten Versionen, bei 
anderen war es umgekehrt. Es zeigte sich jedoch, dass es eine Interaktion zwi- 
schen den narrativen Konsequenzen und der Blickverhaltensvariation gab. Einer- 
seits hatten die fünf Seitenpaare, die in der Pilotstudie als die mit den am wenigs- 
ten erkennbaren narrativen Unterschieden beurteilt wurden, auch keine signifi- 
kanten Auswirkungen in den Vorhersagen der Panelbesuchsrate. Und anderer- 
seits gehörten sechs Seiten, die doch statistische Signifikanz für ihre Interaktion 
mit dem Modifikationsstatus (d.h. mit ‚Lücke‘ vs. ohne ‚Lücke‘) für die Panelbe- 
suche zeigten, alle zu den Seiten, bei denen die Manipulation in der Pilotstudie 
am stärksten als erzählrelevant eingeschätzt wurde. Dies bot dann einen weite- 
ren Triangulationspunkt in Bezug auf die Forschungsfrage. Eine statistisch signi- 
fikante Interaktion zwischen dem Modifikationsstatus und den Seiten schien ge- 
rade in den Fällen wahrscheinlicher zu sein, in denen die Manipulation von den 
Rezipient*innen als stärker narrativ beurteilt wurde. Ohne Berücksichtigung der 
interpretativen Ebene der erzählerischen Wirkung wäre es also nicht möglich ge- 
wesen, eine Erklärung für die bei einigen der Stimuli beobachtete Variation der 
Reaktionen zu geben. Dies lässt sich als Hinweis darauf interpretieren, dass wir 
möglicherweise eine sinnvolle Triangulation über mehrere Abstraktionsebenen 
gefunden hatten. 


4.3 Kohäsion und Blickverfolgung im Film 


Für die letzten beiden Beispiele wenden wir uns dem Medium Film zu, um die 
Methodologie weiter zu beleuchten. Beim ersten Beispiel kombinierten wir Eye- 
tracking-Methoden und multimodale narrative Kohäsionsanalyse, ähnlich wie 
bei der oben geschilderten Studie zur Kohäsion in Comics. Hier wollten wir Be- 
lege dafür sammeln, dass die kohäsive Analyse eine vergleichbare Rolle für die 
Diskursinterpretation beim Film spielt wie bei anderen Medien. In Zusammenar- 
beit mit Kolleg*innen der Universität Potsdam (Tseng et al. 2021) untersuchten 
wir empirisch, wie sich visuelle und auditive Kohäsionsmarker im Film auf die 
Aufmerksamkeit und das Verständnis der Geschichte auswirken können. Die In- 
tegration eines Blickverfolgungsansatzes und einer Kohäsionsanalyse ermög- 
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lichte es uns auf diese Weise, zwei Hauptforschungsrichtungen in der filmischen 
Erzählinterpretation auszubalancieren: (i) die Frage, wie die Lenkung der Auf- 
merksamkeit eines Filmbetrachters das Verständnis von Rezipienten beeinflusst, 
und (ii) die rezeptionsbezogene Frage, wie narrative Elemente im Film die Inter- 
pretation der Bedeutung lenken. 

Das Material für dieses Experiment bestand aus zwei Versionen der Eröff- 
nungsszene von Alfred Hitchcocks berühmtem Film The Birds (1963), in der die 
Protagonistin Melanie eine Straße in San Francisco entlang schlendert und dann 
eine Tierhandlung betritt. Eine detaillierte Kohäsionsanalyse der Szene zeigte, 
wie dieselben Schauplätze, Charaktere und Objekte durch verbale, akustische 
und visuelle Modalitäten miteinander verbunden werden und damit eine kohä- 
rente Interpretation ermöglichen. Anschließend wurde eine manipulierte Ver- 
sion der Szene erstellt, indem bestimmte kohäsive Hinweise entfernt wurden, um 
die Identität des Schauplatzes der Tierhandlung zu verschleiern. Dabei wurden 
auf subtile Weise verbale und akustische Hinweise auf die Umgebung entfernt, 
nämlich ein schriftliches Zeichen, das die Tierhandlung identifiziert, und Vogel- 
gezwitscher innerhalb des Geschäfts. Dies bedeutete, dass die Hinweise auf die 
Tierhandlung in den ersten Einstellungen der Eröffnungsszene außerhalb des 
Geschäfts aus der Aufnahme entfernt wurden, während der darauf folgende Teil 
der Eröffnungsszene innerhalb des Geschäfts visuell identisch war. Die Modifika- 
tion der Szenen fiel beim normalen Zuschauen nicht störend auf. Da die kohäsive 
Modellierung jedoch nahelegt, dass eine Störung der kohäsiven Verbindungen 
auf diese Weise Konsequenzen für die Interpretation haben sollte, wurden den- 
noch ein unterschiedliches Blickverhalten sowie Unsicherheiten bei der Interpre- 
tation vorhergesagt, falls die Kohäsion für die mitwirkenden Zeichenmodalitäten 
eine Rolle spielte. 

Die beiden Versionen wurden zwei Gruppen von Zuschauer*innen präsen- 
tiert, und es wurden sowohl Eyetracking- als auch Fragebogendaten erhoben, um 
ihr Verständnis der gesehenen Szene zu messen. Wir testeten unter anderem die 
folgenden zwei Hypothesen: (i) Die Zuschauer sind sich über den Ort des Gesche- 
hens innerhalb des Ladens weniger sicher und zeigen mehr Orientierungsverhal- 
ten; (ii) dadurch wird die Aufmerksamkeit von Melanie abgelenkt. Die Ergebnisse 
des Fragebogens zeigten, dass die Zuschauer*innen der manipulierten Version 
sich in der Tat ziemlich unsicher über die Art des Geschäfts waren, obwohl ent- 
sprechende visuelle Elemente immer noch leicht zugänglich im Blickfeld waren. 
Im Gegensatz dazu waren sich die Zuschauer des Originals sehr wohl bewusst, 
dass sich die Szene in einem Tiergeschäft abspielt. Darüber hinaus legten die Da- 
ten aus dem Fragebogen nahe, dass die Geräusche (Vogelzwitschern) im Geschäft 
ebenfalls signifikante Hinweise zur Identifizierung der Kulisse waren; die Erset- 
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zung dieser Geräusche durch allgemeine leise Hintergrundmusik führte dazu, 
dass die meisten Zuschauer*innen der manipulierten Version glaubten, dass die 
Szene in einem Kaufhaus stattfand, obwohl die Vögel in Käfigen noch immer ex- 
plizit auf dem Bildschirm zu sehen waren. 

Die Augenbewegungsmuster lieferten weitere Unterstützung für beide Hypo- 
thesen. Die Variabilität der Fixierungspunkte im ersten Teil der Szene im Inneren 
des Ladens war in der manipulierten Version höher, was darauf hindeutet, dass 
die Betrachter*innen das Innere des Ladens in größerem Maße erkunden, ver- 
mutlich um seine Identität festzustellen und die entsprechenden narrativen Ko- 
häsionslücken zu schließen. Im Gegensatz dazu konzentrierten sich die Betrach- 
ter*innen des Originals fast ausschließlich auf Melanie, die im Laden eine Treppe 
hinaufgeht und weitere Aktionen durchführt. 

Zusammenfassend lässt sich sagen, dass die Verwendung von Kohäsions- 
analysen zur Ableitung empirisch überprüfbarer Hypothesen für die hier be- 
schriebenen Blickverfolgungsexperimente in der Tat neue Erkenntnisse darüber 
liefert, wie die Aufmerksamkeit der Betrachter*innen und ihre übergeordnete In- 
terpretation von Charakter- und Raumverhältnissen in empirischen Studien so- 
wohl theoretisch als auch methodisch in Beziehung gesetzt werden können. Aus- 
gehend von unserem analytischen Ergebnis auf der formalen Ebene zeigte diese 
Studie auch, wie subtile digitale Manipulationen einer Filmszene in Kombination 
mit Eyetracking-Daten genutzt werden können, um die Aufmerksamkeitslen- 
kung zu untersuchen, die von Filmemacher*innen üblicherweise für die Erzähl- 
kontinuität eingesetzt wird. 


4.4 Kohäsion und Neurocinematics 


Mit dem letzten Beispiel wurde eine Forschungsstrategie vorgestellt, mit der die 
Relation zwischen technischen Details und Erzählverständnis untersucht werden 
kann. Ausgehend vom gleichen Prinzip der filmischen Kohäsionsanalyse setzten 
wir mit Kolleg*innen an der Aalto-Universität in Finnland neurowissenschaftli- 
che Methoden ein, um zu untersuchen, ob Variationen in Kohäsion auch mit Va- 
riationen der Gehirnaktivität systematisch korrelieren. Als Daten für die Studie 
dienten fMRI-Gehirnscans, die während der Betrachtung von Christopher Nolans 
Film Memento (2000) vorgenommen worden waren (Tseng et al. 2017). Dieser 
Film ist bekanntlich eine Herausforderung für Zuschauer*innen, da er eine um- 
gekehrte zeitliche narrative Organisation aufweist. 

Die schiere Menge an Daten, die in solchen Hirnbildgebungsstudien gesam- 
melt werden, ist immens, und es ist oft keineswegs klar, wo in diesen Datenmen- 
gen interessante Verallgemeinerungen zu suchen sind. Dafür haben wir die Ana- 
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lyse der Kohäsion verwendet. Auf der Basis der Kohäsionsanalyse lassen sich 
kontrastierende Diskurssituationen definieren, normalerweise bezüglich der Fort- 
setzung bzw. Unterbrechung von interagierenden kohäsiven Ketten. Für die ak- 
tuelle Studie wurden zwei Diskurssituationen, bei denen kontrastierende Mecha- 
nismen der Erzählkonstruktion mobilisiert wurden, auf Basis der Kohäsionsmus- 
ter definiert. Ihre Vorkommen im Film wurden dann durch die Zeitintervalle, 
während denen sie auftraten, dokumentiert. Dafür wurde der ganze zeitliche Ab- 
lauf der Gehirndaten mit ‚Ereignisfenstern‘ unterlegt, während zugleich spezifi- 
zierte Kohäsionsmuster für die betrachtete Filmsequenz definiert wurden. Auf 
dieser Basis konnten gezielte Mengen von Gehirndaten daraufhin untersucht 
werden, ob systematisch wiederkehrende Gehirnaktivitätsmuster gefunden wer- 
den konnten. 

Zwei zentrale Hypothesen wurden von der Studie ins Visier genommen. Ers- 
tens untersuchten wir, ob differenzierte kohäsionsbasierte Ereignisbeschreibun- 
gen des Films für messbare neurologische Reaktionen prädiktiv waren. Wichtig 
war dabei, dass die Ausformulierung der Beschreibungen auf der Diskursebene 
als eine Methode untersucht wurde, um über die Ergebnisse auf weniger abstrak- 
ten Wahrnehmungsebenen, wie z.B. Reaktionen auf audiovisuelle Stimuli, hin- 
auszugehen. Es wäre keine Überraschung, wenn beim Betrachten von visuell 
identischen Szenen Regelmäßigkeiten im Hirnverhalten der Proband*innen in 
eher front-end (d.h. stimulus-nahen) visuellen Verarbeitungsbereichen des Ge- 
hirns gefunden würden. Wenn aber auf der Grundlage der Diskursstrukturen Re- 
gelmäßigkeiten in Gehirnbereichen gefunden werden könnten, die für tiefere 
Verarbeitung bekannt sind, wäre das ein starkes Indiz dafür, dass eine weitere 
Quelle für produktive Triangulationen festgestellt worden ist. Das heißt, anstatt 
zu sehen, wie Schnitttechniken oder visuelle Stimuli mit verschiedenen Gehirn- 
reaktionen zusammenhängen, weisen die Analyse und die Ergebnisse darauf 
hin, dass es möglich ist, das Abstraktionsniveau auch in solchen Untersuchun- 
gen durch die Herstellung einer Verbindung mit der Diskurssemantik zu erhö- 
hen. 

Dieses zentrale Ziel, Korrelationen zwischen Diskursstrukturen, die als kohä- 
siv zusammenhängend abgeleitet wurden, und tatsächlichen Rezeptionsprozes- 
sen im Gehirn zu finden, wurde erreicht. Die unterschiedlichen Sets von Diskurs- 
realisierungen schienen in der Tat mit signifikanten Unterschieden in den Hirn- 
daten zu korrelieren. Die Verlässlichkeit solcher Ergebnisse bietet dann einen 
Studienzweig parallel zu den traditionelleren Anliegen, die neurale Aktivität mit 
der Ästhetik in Beziehung zu setzen (vgl. Changeux 1994; Aldama 2015). Statt äs- 
thetischer Antworten im weiteren Sinne fokussiert sich die Aufmerksamkeit hier 
eher auf differenzierte Strategien, die von den Filmemacher*innen im Dienste 
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bestimmter, gewollter Rezeptionseffekte eingesetzt zu werden scheinen. Diese 
Strategien ließen sich einerseits als Kohäsionsmuster darstellen und andererseits 
als wiederkehrende Muster von Gehirnaktivität erkennen. Eine logische Fortset- 
zung dieser Arbeit ist dann die Suche nach Korrelationen zwischen den Daten- 
mustern des Gehirns und weitere abstrakteren, narrativ-relevanten Charakteri- 
sierungen der Filmrezeption. Eine entsprechende Studie wurde bereits für ver- 
bale Texte vorgelegt (vgl. Ferstl & von Cramon 2001), aber bisher hat das Fehlen 
von einem entsprechend differenzierten Zeichenmodalitätsmodell Untersuchun- 
gen außerhalb des Sprachsystems verhindert. Das Konzept der Diskurssemantik 
als einer vermittelnden Ebene, mit der diverse Sinnesmodalitäten in Beziehung 
zueinander gesetzt werden können, bietet eine Grundlage dafür, jetzt über diesen 
Zustand hinauszukommen. 


5 Zusammenfassung und zukünftige 
Ausrichtungen 


Die Idee, über verschiedene Disziplinen hinweg zu triangulieren, um komple- 
mentäre Zugangsmöglichkeiten zu einem komplexen Analyseobjekt zu erhellen, 
wird immer praktikabler und ermöglicht zunehmend raffiniertere (auch experi- 
mentelle) Untersuchungsdesigns. In diesem Beitrag haben wir über mehrere Ver- 
feinerungen dieser allgemeinen Idee berichtet, in denen weitere ‚Punkte‘ der Tri- 
angulation hinzugefügt wurden, die direkt aus unserem allgemeinen semioti- 
schen Modell der Multimodalität abgeleitet sind. Auf diese Weise werden diffe- 
renzierte und funktional motivierte semiotische Artikulationen eines zu analysie- 
renden Gegenstands sowohl mit abstrakteren Interpretationsschemata als auch 
mit direkt materiell feststellbaren Erscheinungsformen in Beziehung gesetzt. Die- 
ser Auffassung zufolge dienen die verschiedenen Arten von Diskursanalysen als 
vermittelnde Beschreibungen auf einer ‚Zwischenebene‘, die einerseits in Bezug 
auf spezifische Kombinationen technischer Merkmale in einem Medium operati- 
onalisierbar sind und andererseits dazu dienen, abstraktere Deutungsverläufe 
auf Seiten der Rezipient*innen vorherzusagen sowie zu erklären. Diese letzteren 
sollten dann wiederum mit messbaren Rezeptionsunterschieden korreliert wer- 
den können. Die Relation von Diskursbeschreibungen zu anderen — mehr oder 
weniger abstrakten Ebenen - bietet daher einen Rahmen, innerhalb dessen em- 
pirische Vorhersagen über die flexible Aufnahme von Zeichen durch eine*n Le- 
ser*in, Zuhörer*in, Benutzer*in usw. während der Rezeption konzeptualisiert 
werden können (Bateman & Wildfeuer 2014). 
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Solche Vorhersagen können jedoch nur so genau sein wie die Darstellung der 
angenommenen Diskursorganisation. Um diese Praxis aufzuzeigen, haben wir in 
diesem Beitrag über konkrete Beispiele aus unseren aktuellen Studien zum Film 
und zur visuellen Erzählung in Comics und Graphic Novels berichtet. Es wurde 
gezeigt, wie eine breite semiotische Konzeption der Multimodalität explizit auf 
die empirische Untersuchung ausgerichtet werden kann. In allen Fällen bleiben 
jedoch unsere Ergebnisse in diesem Stadium weitgehend explorativ. Der Haupt- 
zweck dieses Beitrags besteht daher darin, Richtungen aufzuzeigen, in denen se- 
miotische Analysen in Zukunft weitergeführt werden können, damit die immer 
wieder auftretende Schwäche der traditionellen semiotischen Forschung in Be- 
zug auf ihre mangelhaften empirischen Grundlagen durch reflektierten Einsatz 
von linguistisch inspirierten Methoden behoben werden kann. 

Die stratifizierte Auffassung von Bedeutung, die als Folge unseres semioti- 
schen Modells angenommen wurde, deutet damit an, wie wir eine tiefe Kluft zwi- 
schen verschiedenen Ansätzen der Bedeutungsanalyse, die sich manchmal sogar 
feindselig gegenüberstehen, wirksam überbrücken können. Insbesondere erach- 
ten wir die anhaltende Trennung zwischen eher hermeneutischen und diskursi- 
ven Interpretationen einerseits und formal bzw. quantitativ orientierten Ansät- 
zen der Analyse und Ästhetik andererseits als besonders kontraproduktiv. Die 
mangelnde Interaktion zwischen diesen Forschungsrichtungen macht es für die 
hermeneutische Interpretation schwierig, eine solide empirische Unterstützung 
zu erreichen, und verhindert gleichzeitig, dass empirische Analysen auf herme- 
neutisch und/oder soziokulturell relevante Fragen angewendet werden. Dazu be- 
nötigten wir Methoden zur Konstruktion von Hypothesen, die eigens dafür for- 
muliert wurden, um zu untersuchen, wie Erkenntnisse zur Kognition und die 
abstrakten Ebenen der Stilistik, des Genres und der breiteren sozialen und kultu- 
rellen Kontexte formal zusammenhängen. 

Die Grundlage unseres Ansatzes war daher die Annahme, dass ein stratifi- 
ziertes, mehrstufiges Verfahren für die semiotische Analyse ein sensibleres In- 
strument zur Herausarbeitung signifikanter formaler Unterschiede darstellen 
kann, die auch als konstitutive Unterschiede auf höheren, soziokulturellen Abs- 
traktionsebenen betrachtet werden können. Methodisch funktioniert dieser An- 
satz durch die Identifizierung ‚vertikaler‘ Schnitte durch die oben in Abbildung 1 
(obere Grafik) dargestellten Schichten der medialen Konfigurationen und der Zei- 
chenmodalitäten, um Beschreibungen auf verschiedenen Abstraktionsebenen zu 
liefern, die dennoch komplementär in Beziehung zueinander gesetzt werden 
können. Dadurch wird ein allgemeines Modell für die Untersuchung von semio- 
tisch anspruchsvollen Gegenständen jeder Art zur Verfügung gestellt. 
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Eine der wichtigsten Erkenntnisse aus der hier vorgestellten Forschungsrich- 
tung und den verfolgten empirischen Untersuchungen ist die erweiterte Anwend- 
barkeit analytischer Methoden aus der Sprachwissenschaft, so dass sie für jede 
multimodale Kommunikation relevant werden. Die Diskussion über solche Er- 
weiterungen wird schon seit langem in Bezug auf die gesprochensprachliche In- 
teraktion geführt, aber selten für darüber hinausgehende Fragestellungen - in 
solchen Diskussionen wird sogar ‚Multimodalität‘ häufig als Synonym für gespro- 
chene Face-to-face-Interaktion gesehen. Erweiterungen in diesem Bereich befas- 
sen sich folglich lediglich mit Kombinationen von gesprochener Sprache, Gestik, 
Intonation oder Proxemik. Perniss (2018) bietet einen nützlichen Überblick über 
solche Erweiterungen, darunter auch Argumente aus neueren Ergebnissen der 
Neurowissenschaften, die Ansätze, die von Unterschieden zwischen ‚linguisti- 
schem‘ und ‚nicht-linguistischem‘ Kommunikationsverhalten ausgehen, grund- 
sätzlich in Frage stellen. Diese Forschungslinie weist jedoch insofern eine anhal- 
tende Schwäche auf, als sich die vorgeschlagenen Ansätze überwiegend auf 
Überlegungen zu Erweiterungen des Grammatik-Begriffs beschränken. Wie wir 
im vorliegenden Beitrag argumentiert haben, ist Multimodalität jedoch ein weit- 
aus umfassenderer Phänomenbereich. Erstens erstreckt sich Multimodalität auf 
alle Formen der Kommunikation, einschließlich der visuellen, akustischen, be- 
wegungsbasierten und haptischen und ist somit keineswegs auf die gesprochene 
Interaktion beschränkt. Zweitens kommt, wie wir bereits mehrfach betont haben, 
ein großer Teil der Kraft der multimodalen Kommunikation aus der Vielfalt und 
Flexibilität von Diskursprozessen, die jenseits der Grammatik ablaufen. 

Auch in Bezug auf visuelle Kommunikation gibt es Vorschläge, die für eine 
engere Verbindung zwischen bildwissenschaftlichen Studien und sprachwissen- 
schaftlichen Ansätzen plädieren (vgl. Spillner 1982; Schmitz 2003; van Leeuwen 
2004; Fix 2008; Klug 2013). Laut van Leeuwen: 


Speech acts should be renamed communicative acts and understood as multimodal micro- 
events in which all signs present combine to determine its communicative intent. (van 
Leeuwen 2004: 8) 


Genres of speech and writing are in fact multimodal: speech genres combine language and 
action in an integrated whole, written genres combine language, image, and graphics in an 
integrated whole. Speech genres should therefore be renamed ‘performed’ genres and writ- 
ten genres ‘inscribed’ genres. Various combinations of performance and inscription are of 
course possible. (van Leeuewn 2004: 10) 


Wir haben diese Auffassung von Kommunikation und ihrer Erforschung zum 
Ausgangspunkt genommen und darüber hinaus gezeigt, wie diese radikale Er- 
weiterung dessen, was als Gegenstand einer linguistischen Untersuchung zu be- 
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trachten ist, dennoch präzise erfasst und empirisch untersucht werden kann. Für 
viele Forschungsfragen, die Themen der Grammatik, der Semantik, des Diskur- 
ses, des Genres und des Stils umfassen, betrachten wir die Ergebnisse, die wir für 
die multimodale Kommunikation erhalten, als von unmittelbarer Bedeutung für 
die adäquate Theoretisierung dieser Begriffe auch innerhalb der Sprachwissen- 
schaft. Und damit sind wir wieder beim Anfang und dem dort angeführten Zitat 
von Saussure. In allen Fällen gilt jedoch: Je präziser der Zusammenhang zwi- 
schen empirischer Analyse und geeigneten sprachwissenschaftlichen Begriff- 
lichkeiten hergestellt werden kann, desto aussagekräftiger werden die Ergeb- 
nisse sowohl für die sprachwissenschaftliche Diskussion und Theoriebildung als 
auch für multimodale Anwendungskontexte im weiteren Sinne sein. 
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Teil Il: Interaktionsbedingungen als 
methodologische Herausforderung 


Karola Pitsch 

Mensch-Roboter-Interaktion als 
Forschungsinstrument der Interaktionalen 
Linguistik 


Situiertheit von Interaktion und das Design referenzieller 
Praktiken 


Abstract: Ausgehend von einer Konvergenz zwischen den aktuellen Herausfor- 
derungen, die sich zum einen einer multimodal orientierten Interaktionalen Lin- 
guistik und zum anderen im Bereich der Social Robotics stellen, schlagen wir ei- 
nen neuartigen methodologischen Ansatz vor. Dieser besteht darin, Mensch-Ro- 
boter-Interaktion als ein Forschungsinstrument der Interaktionalen Linguistik zu 
konzipieren. Dieses wird am Beispiel des Phänomens ‚Referenzielle Praktiken‘ 
und anhand von Daten aus mehreren Studien ausbuchstabiert, in denen ein hu- 
manoider Roboter (Nao) in der Rolle eines Museumsführers vorbeikommenden 
Besuchern Informationen zu ausgewählten Exponaten anbietet, auf die er sie 
durch multimodal gestaltete lokal-deiktische Verweise zu orientieren versucht. 


Keywords: Interaktionale Linguistik, Mensch-Roboter-Interaktion, Social 
Robotics, semi-experimentelle Studien, Multimodalität, Situiertheit, Situated 
Action, referenzielle Praktiken, Deixis 


1 Einleitung: Multimodalität und Situiertheit in 
der Interaktionalen Linguistik 


In dem Maße, in dem in der Interaktionalen Linguistik (Couper-Kuhlen & Selting 
2018) vermehrt die multimodale Eingebettetheit von Sprache als Ressource zur 
Organisation von Kommunikation und sozialer Interaktion wichtig wird (Mon- 
dada 2014, Keevalik 2018), stellt sich die methodologische Frage, wie das Zusam- 
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menspiel der verschiedenen kommunikativen Ressourcen - Sprache, Blick, Kopf- 
orientierung, Gestik, Körperpositur etc. — systematisch beschrieben werden 
kann. Geht man grundlegend von der Situiertheit sozialer Interaktion (Goodwin 
2000, Hausendorf 2015) aus, dann versteht man die emergierenden sprachlichen 
wie verkörperten Strukturen als komplexe holistisch-multimodale Gestalten, die 
von den Interaktionsbeteiligten dynamisch und flexibel hervorgebracht werden 
und als kontingente Lösungen zur Bearbeitung der anstehenden kommunikati- 
ven Aufgaben lokal mobilisiert werden. Im praktischen Handlungsvollzug wer- 
den sie im kleinschrittigen interaktiven Wechselspiel mit dem/den Ko-Partizipi- 
enten und im Rahmen der lokalen ‚ecology‘ sukzessive konfiguriert und re- 
konfiguriert (Goodwin 2000, Mondada 2014: 139), so dass ihre genaue Ausgestal- 
tung situativ bedingt und damit nicht in ihren Details vorhersehbar ist (Schegloff 
1996). Als methodologische Herausforderungen für eine moderne Interaktionale 
Linguistik stellen sich damit insbesondere die folgenden Fragen (vgl. Mondada 
2014: 139; Keevallik 2018, Couper-Kuhlen 2018): Wie lässt sich das Zusammen- 
spiel der verschiedenen Ressourcen als Teil von „multimodal packages“ unter 
verschiedenen Bedingungen beschreiben? Woran orientieren sich Interaktions- 
beteiligte bei der Rezeption von multimodalen Gestalten und welche Funktionen 
übernehmen dabei die einzelnen Ressourcen? Wie kann man angesichts der Va- 
riabilität von multimodalen Gestalten systematische Kollektionen von vergleich- 
baren Fällen erstellen? 

Diese aktuellen Fragen einer multimodal orientierten, von „situated actions“ 
ausgehenden Interaktionalen Linguistik stellen zugleich auch zentrale Heraus- 
forderungen im Forschungsbereich der Social Robotics bzw. Human-Robot-Inter- 
action (Breazeal et al. 2016, Dautenhahn 2014) dar. So stellt Breazeal (2003: 167) 
fest: „The success of these robots hinges not only on their utility but also on their 
ability to be responsive to and interact with people in a natural and intuitive man- 
ner“. Verfolgt man das Ziel, Roboter, virtuelle Agenten und andere technische 
Systeme mit Ressourcen auszustatten, die es Menschen erlauben, diese intuitiv 
mit den Mitteln natürlichsprachlicher Kommunikation zu nutzen, stellt sich da- 
her die Frage, wie das kommunikative und interaktive Verhalten des Roboters/ 
Agenten gestaltet werden soll und wie dieses mit der Situiertheit sozialer Inter- 
aktion umgehen kann (vgl. Schegloff 1996). 

An dieser interdisziplinären Schnittstelle setzt der vorliegende Beitrag an. Er 
verfolgt das Ziel, auszuloten inwieweit das Modellieren von Interaktionsverhal- 
ten für einen humanoiden Roboter und dessen Erproben in semi-experimentellen 
Studien zur Mensch-Roboter-Interaktion als Instrument für die Erforschung von 
multimodaler Kommunikation und sozialer Interaktion dienen kann (vgl. Pitsch 
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et al. 2012, 2013b, 2014a, 2014b 2016).! Dieser Ansatz greift zum einen Suchmans 
(2006: 186) Gedanken auf: „Just as the project of building intelligent artifacts has 
been enlisted in the service of a theory of mind, the attempt to build interactive 
artifacts, taken seriously, could contribute much to an account ofsituated human 
action and shared understanding.“ Zum anderen ist er anschlussfähig an aktu- 
elle Vorschläge in Konversationsanalyse und Interaktionaler Linguistik, die die 
Fokussierung auf authentische Alltagsinteraktion um Studiendesigns mit geziel- 
ter Manipulation von Bedingungen in semi-experimentellen Labor-Experimenten 
ergänzen (Pitsch et al. 2014a, Kendrick 2017, de Ruiter & Albert 2017, Heath & Luff 
2018). Dieses Ziel wird im Folgenden am Phänomen referenzieller Praktiken bzw. 
Lokal-Deixis und im Szenario eines Museums-Roboters nachgegangen: Wie lässt 
sich das Design von referenziellen Praktiken für einen humanoiden Museumsro- 
boter von Erkenntnissen aus der menschlichen Interaktionsforschung inspirie- 
ren? Wie gehen Museumsbesucher in der „real world“ mit den kommunikativen 
Angeboten eines autonomen Roboters um? 

Zur Beantwortung dieser Fragen werden wir zunächst den Ansatz der Kon- 
versationsanalyse und ihr Verhältnis zu methodischen Ansätzen der Manipula- 
tion von Interaktionsbedingungen beleuchten (Kap. 2) und auf dieser Basis un- 
seren Ansatz präsentieren, Mensch-Roboter-Interaktion als ein neuartiges 
methodisches Instrument zur Erforschung von situierter multimodaler Kommu- 
nikation zu verwenden (Kap. 3). Auf einen kurzen Überblick zum Forschungs- 
stand zu ‚Referenziellen Praktiken‘ und dessen zentralen Desideraten (Kap. 4) 
wird — nach einer Beschreibung der Studien (Kap. 5) - in zwei analytischen 
Schritten untersucht, wie Museumsbesucher die multimodal gestalteten referen- 
ziellen Verweise eines humanoiden Museumsroboters behandeln (Kap. 6 und 7). 
Abschließend werden kurz die Möglichkeiten und Grenzen des präsentierten An- 
satzes diskutiert (Kap. 8). 


1 Die Studien wurden in den Projekten „Interaktion & Raum“ (Volkswagenstiftung, PI: K. 
Pitsch) und „Incremental Coordination in Human-Robot-Interaction“ (DFG-EXC-277 CITEC, PI: 
K. Pitsch & S. Wrede) unter Mitwirkung von R. Gehle, T. Dankert, M. Görlich und J.-C. Seele 
durchgeführt. Die Autorin dankt zudem Vivien Ebben für ihre Unterstützung bei der Anonymi- 
sierung der Standbilder. 
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2 Multimodale Kommunikation und soziale 
Interaktion: methodische Instrumente 


Das Empirieverständnis der ethnomethodologischen Konversationsanalyse bein- 
haltet traditionell eine Fokussierung auf die Untersuchung von Daten aus au- 
thentischen Interaktionssituationen. In jüngerer Zeit zeigt sich darüber hinaus, 
dass ihre Forschungsergebnisse viel Anschlusspotenzial in interdisziplinären 
Kontexten bieten, wie z.B. Psycholinguistik, Robotik, Conversational Al etc., die 
sich mit interaktiven Fragestellungen in primär quantitativen oder modellieren- 
den Forschungsparadigmen beschäftigen. Daher stellt sich die Frage, inwieweit 
die ethnomethodologische Konversationsanalyse gewinnbringend mit anderen 
Ansätzen und Paradigmen kombiniert werden kann (s. auch Pitsch et al. 2014a, 
Kendrick 2017). 


2.1 Konversationsanalyse und die Manipulation von 
Bedingungen sozialer Interaktion 


Entsprechend ihrer ethnomethodologischen Provenienz und ihres empirischen 
Grundverständnisses interessiert sich die Konversationsanalyse traditionell für 
die sozialen Praktiken und Verfahren, mit denen Interaktionsbeteiligte in au- 
thentischen Alltagssituationen ihre kommunikativen Aufgaben bearbeiten. An- 
gesichts der Dynamik und Variabilität in der konkreten Ausgestaltung dieser 
Praktiken als multimodale Gestalten stellt sich - wie Mondada (2014: 139) formu- 
liert - die grundlegende Frage, „how participants in social interaction mobilize a 
set of resources for the locally situated, intersubjective and methodic organiza- 
tion of action“. In methodologischer Hinsicht besteht also die zentrale Frage da- 
rin, herauszufinden, (i) wie die verschiedenen kommunikativen Ressourcen in je 
unterschiedlichen emergent-kontingenten Situationen zu multimodalen Gestal- 
ten konfiguriert und dynamisch re-konfiguriert werden, (ii) woran sich Interakti- 
onsbeteiligte bei ihrer Rezeption orientieren, (iii) welche Funktionen die einzel- 
nen Ressourcen in der je spezifischen Situation und Ökologie einnehmen und (iv) 
wie man unter den Bedingungen solcher Variabilität systematische Kollektionen 
von vergleichbaren Fällen erstellen kann (vgl. Mondada 2014; Stukenbrock 2015, 
Keevallik 2018, Couper-Kuhlen 2018). 

Ein naheliegender Ansatz dafür, das Zusammenspiel der Ressourcen im Rah- 
men sozialer Praktiken tiefergehend zu erforschen, besteht darin, ein möglichst 
großes Korpus verschiedenster Alltagssettings zu untersuchen: „for the study of 
the respective calibration of multimodal resources, the diversification of settings 
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and activities to analyze is crucial, in order to go beyond face to face conversation 
and explore a variety of multimodal praxeological configurations“ (Mondada 
2014: 140). In diesem Sinne ist z.B. Hirschauers (1999) Vorschlag, den Fahrstuhl 
als ein „soziologisches Forschungsinstrument“ (222) zu nutzen paradigmatisch. 
Durch die spezifische räumliche Konfiguration dieses „Soziotops“ (223) - d.h. 
insbesondere seine Enge und Umbautheit — werden spezifische Interaktionsbe- 
dingungen hergestellt und damit die Grundparameter der sozialen Ordnung in 
einem authentischen Alltagssetting variiert. 

Ein alternativer Ansatz besteht in der gezielten Herstellung spezifischer In- 
teraktionsbedingungen. Dieser steht allerdings in Gegensatz zum traditionellen 
Primat des Untersuchens authentischer Interaktionssituationen in der Konversa- 
tionsanalyse. Erst in jüngster Zeit beginnt eine methodologische Diskussion dar- 
über, inwieweit die Konversationsanalyse mit semi-experimentellen Arbeitswei- 
sen kombinierbar ist (Kendrick 2017, de Ruiter & Albert 2017). Gleichzeitig kann 
dabei auf frühe und wegweisende Studien zurückgegriffen werden. Zum einen 
hat bereits Garfinkel (1967) in den „Breaching Experiments“ seine Interaktions- 
partner mit absichtlich unerwarteten Gesprächsbeiträgen konfrontiert, um so die 
Normalität sozialer Ordnung und Handlungen aufzudecken sowie die Verfahren 
sichtbar zu machen, mit denen sie die entstehenden Brüche bearbeiten. Zum an- 
deren liegen Suchmans (1987/2006) wegweisender Studie zu „Plans and Situated 
Action“ Videoaufzeichnungen von Situationen zugrunde, die im Rahmen einer 
semi-experimentellen Studie entstanden sind: Zwei Personen werden zu Nutzern 
eines neuen, technischen Geräts (hier: Kopierer) und gebeten, für den Zweck der 
Untersuchung ein Set an definierten Aufgaben damit zu erledigen. Methodolo- 
gisch zentral in unserem Kontext ist der Umgang mit diesen Daten (vgl. zur Argu- 
mentation Pitsch et al. 2014a): Die Art, wie die Teilnehmer die Aufgaben erledi- 
gen, ist nicht weiter vorgegeben, und die Fragestellung und Analyse der entste- 
henden Interaktionen folgen keiner quantifizierend-experimentellen Logik. Viel- 
mehr werden anhand der entstandenen Daten die - unter den geschaffenen Be- 
dingungen - authentischen Handlungen der Interaktionsbeteiligten ethnogra- 
phisch-konversationsanalytisch untersucht und daran explorativ der grundle- 
sende Unterschied zwischen den situierten und kontingenten menschlichen und 
den planbasierten Handlungslogiken des technischen Geräts herausgearbeitet. 
Auf diesen Gedanken aufbauend beschreiben auch Heath & Luff (2018) ihren ex- 
plorativen Ansatz zu Design und Erforschung von Workplace-Technologien unter 
dem Label eines „quasi-naturalistic experiment“. Hierunter werden Labor- wie 
Feldexperimente verstanden, die — entsprechend dem Interesse der Autoren an 
sozialen Praktiken im Workplace-Setting - in die diesbezügliche ethnogra- 
phisch-konversationsanalytische Feldforschung eingebettet sind. Sie werden als 
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Bestandteil eines „broader program of naturalistic research“ (467) mit genuin ex- 
plorativem Charakter verstanden: „to explore and assess the impact of a particu- 
lar set of practices, techniques, or technologies“ (467) und „to expose the un- 
known or unexpected aspects of social organization“ (469). 

Vor dem Hintergrund dieser ersten Ansätze, semi-experimentelle Arbeitswei- 
sen mit konversationsanalytischer Herangehensweise zu verbinden, argumen- 
tiert Kendrick (2017) programmatisch für eine Öffnung der Konversationsanalyse 
hin zu einem methodischen Pluralismus, der die naturalistische Beobachtung 
durch experimentelle Studiendesigns, Labor-Settings und Quantifizierung er- 
gänzt. Als Gewinn der Überwindung der bisherigen methodischen Dichotomie 
führt er eine Reihe an neuen methodischen Möglichkeiten an. Diese konvergieren 
mit unserem Ansatz, Mensch-Roboter-Interaktion als ein Instrument der Interak- 
tionalen Linguistik zu verstehen (vgl. Pitsch et al. 2012, 2013b, 2014a, 2014b, 2016, 
2020): (a) das Überprüfen der Robustheit von Erkenntnissen aus menschlicher 
sozialer Interaktion unter anderen, spezifischen (hier: technologisierten) Bedin- 
gungen, (b) die interdisziplinäre Anschließbarkeit von konversationsanalyti- 
schen Erkenntnissen an Informatik und Social Robotics; (c) der Zugewinn neuer 
Aufzeichnungs- und Datenerhebungsmethoden; sowie (d) die Frage des Verhält- 
nisses von Ergebnissen aus Alltagswelt und Laborkontexten. Die Möglichkeiten 
und Grenzen eines solchen Verfahrens sollen im vorliegenden Text eruiert wer- 
den. 


2.2 Mediated Communication und Mensch-Maschine- 
Kommunikation 


In der linguistischen wie gesprächsanalytischen Forschung besteht eine lange 
Tradition in der Berücksichtigung der medialen Bedingungen von Kommunika- 
tion, wie sie durch den Einsatz verschiedener Kommunikationstechnologien ent- 
stehen (vgl. Computer-Mediated Communication, Herring 1996). Dieses gilt so- 
wohl für mündliche Kommunikationsformate vom Telefon über Videotelefonie 
bzw. Videokonferenz-Systeme und Media Spaces bis hin zu Augmented Reality- 
Szenarien als auch für an schriftsprachliche Bedingungen anschließende For- 
mate wie Chat, SMS/WhatsApp oder Twitter. In diesen Arrangements werden je- 
weils durch die technologische Verfasstheit spezifische Bedingungen induziert, 
unter denen die menschlichen Interaktionsbeteiligten miteinander interagieren. 
Diese betreffen insbesondere verschiedene Dimensionen von Zugänglichkeit - 
etwa Zeitlichkeit, Sichtbarkeit und Räumlichkeit -, an deren Bearbeitung sich die 
Interaktionsbeteiligten in ihren Beiträgen orientieren. In einem solchen Ansatz 
der ‚Mediated Communication‘ ist allerdings der Umgang mit einem technischen 
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Agenten bislang weitgehend unberücksichtigt geblieben (s. aber Lotze 2016). Erst 
in jüngster Zeit plädieren Arminen et al. (2016) für eine breitere Perspektive auf 
Mediatisierung. Davon ausgehend, dass die Wahrnehmung der Welt immer me- 
diatisiert ist, schlagen sie anstelle eines Dualismus zwischen ,unmediatisierten‘ 
(face-to-face) und mediatisierten Situationen ein Kontinuum mit den zwei Polen 
„Medium Immersed“ und „Tool Using“ vor. Hierüber sollen verschiedene mate- 
rielle Konstellationen abbildbar sein, die jeweils daraufhin befragt werden kön- 
nen, wie „the production of particular sequences may be accomplished, enabled, 
constrained, or inhibited“ (293). In einem solchen Kontinuum lassen sich aus 
Sicht der Autoren auch hybride/intermediäre Formen verorten, wie z.B. Mensch- 
Roboter-Konstellationen. Wenngleich also neuerdings die Konstellation Mensch- 
Agent/Roboter prinzipiell als ein Aspekt mediatisierter Kommunikation mit an- 
gedacht wird, ist allerdings noch völlig ungeklärt, wie der Spezifik einer solchen 
„sozio-technischen Konfiguration“ (Rammert 2008) Rechnung getragen werden 
kann. Welchen Status weisen die menschlichen Interaktionsbeteiligten einem 
Roboter zu? Wie (wenn überhaupt) wird er möglicherweise als Ko-Partizipant de- 
finiert? 

Im Bereich der linguistischen Erforschung von Mensch-Maschine-Kommuni- 
kation stand bis dato primär die Art und Weise im Fokus, wie Menschen mit Tech- 
nologie sprechen (z.B. Weingarten 1989, Fischer 2006, 2010, 2011). Die multimo- 
dale Eingebundenheit von Sprache sowie insbesondere die interaktive Dimen- 
sion - d.h. die Koordinierung von Handlungen - blieben dabei weitgehend un- 
berücksichtigt. In jüngerer Zeit beginnen Pitsch et al. (2012, 2013) zu zeigen, wie 
die verbalsprachlichen Erklärungen und manipulativen Handlungen eines men- 
schlichen Tutors in ihrer Sequenzialität und konkreten Handlungsoptionen von 
den Aktivitäten des Roboters mit-konfiguriert werden. Ähnlich interaktiv fokus- 
sierend zeigen Porcheron et al. (2018) wie die menschlichen Nutzer im Umgang 
mit dem Voice Interface ‚Alexa‘ ihre Äußerungen so designen, dass sie in die je- 
weiligen, durch das System vorgesehenen Slots hineinpassen. Solche an die Si- 
tuiertheit von Kommunikation anschließenden Herangehensweisen bieten neue 
Perspektiven für die linguistische Dimension von Mensch-Maschine-Kommuni- 
kation. 


2.3 Konversationsanalyse und Entwicklung neuer 
Technologien 


Im Rahmen der Workplace Studies hat die Konversationsanalyse ein traditions- 
reiches Interesse am Erforschen von neuen Technologien in interaktiven und so- 
zialen Situationen wie auch am Mitwirken bei ihrer Gestaltung und Entwicklung 
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(Suchman 2006, Heath & Luff 2018, Dourish & Button 1998). So haben frühe Stu- 
dien das Potential von konversationsanalytischen Ideen für die Gestaltung von 
text-basierten Dialogsystemen herausgestellt und vorgeschlagen, die Annahmen 
und Prinzipien von sequenziellen Strukturen und des lokalen Managements aus 
der Mensch-Mensch-Interaktion für die technische Modellierung zu überneh- 
men. Dieses anhand von Phänomenen wie Turn-Taking, Nebensequenzen oder 
Pre-Closings ausbuchstabierend, zielen Frohlich & Luff (1990:189) darauf „to see 
how productively the technology of conversation can be used to reproduce the 
details of actual, naturally occurring conversations between people, in conversa- 
tions between people and computers“. Während solche Versuche einerseits als 
„simulacrum of conversation“ kritisiert wurden (Button 1990), bringen sie ande- 
rerseits den Vorschlag ein, die Erkenntnisse über das Funktionieren von sozialer 
Interaktion für die Gestaltung von technischen Systemen fruchtbar zu machen. 

Wenn wir uns heute mit der konzeptuellen Perspektive und dem methodi- 
schen Ansatz von Konversationsanalyse und Interaktionslinguistik im Bereich 
der ‚Social Robotics‘ beschäftigen und die Mensch-Roboter-Interaktion als ein In- 
strument für die Erforschung der Details von situierter Interaktion explorieren 
wollen, dann ist nicht das Ziel, die Möglichkeiten und Funktionsweise von 
menschlicher Kommunikation in einem technischen System zu reproduzieren. 
Vielmehr steht das Erforschen einzelner kleiner ‚Building Blocks‘ im Fokus, an- 
hand derer das multimodale Zusammenspiel verschiedener kommunikativer 
Ressourcen im Rahmen der Dynamik von situierter Interaktion erprobt werden 
kann. Das Design der Strukturen ist dabei von den Erkenntnissen aus Interakti- 
onslinguistik, Gesprächsforschung, Konversationsanalyse etc. inspiriert, wird a- 
ber in eine neue, nun sozio-technische Konstellation eingebunden, in der zu- 
nächst grundsätzlich eigenständige Bedingungen herrschen. Inwieweit die aus 
der menschlichen Interaktion bekannten Verfahren auch in diesem Kontext pro- 
duktiv sind, ist eine offene, empirisch zu beantwortende Frage. 


3 Mensch-Roboter-Interaktion als methodisches 
Instrument zur Erforschung von ‚Situated 
Action‘ 


Basierend auf der Feststellung, dass einerseits eine zentrale Herausforderung in 
der interaktionslinguistischen Erforschung von multimodaler Kommunikation 
darin besteht, die Dynamik der Konfiguration von „multimodal packages“ zu ver- 
stehen, und andererseits eine methodische Öffnung der Konversationsanalyse zu 
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semi-experimentellen Ansätzen (vgl. Kendrick 2017) neue Möglichkeiten zur 
Frage der Robustheit interaktiver Phänomene bieten kann, schlage ich vor, 
Mensch-Roboter-Interaktion als ein methodisches Instrument zur Erforschung 
der Situiertheit von multimodaler Kommunikation und sozialer Interaktion ein- 
zusetzen. Ein solcher Ansatz ist an der interdisziplinären Schnittstelle von Inter- 
aktionaler Linguistik, Konversationsanalyse, Multimodaler Interaktion und In- 
formatik, Robotik, Künstlicher Intelligenz angesiedelt und trifft auf die aktuelle 
Herausforderung im Bereich der Social Robotics, technische Systeme so mit kom- 
munikativen Fähigkeiten auszustatten, dass sie vom menschlichen Nutzer mit 
Mitteln natürlicher Kommunikation bedienbar sind. 

Verwendet man Mensch-Roboter-Interaktion als ein methodisches Instru- 
ment zur Erforschung von situierter multimodaler Kommunikation, so lassen 
sich Erkenntnisse auf verschiedenen Ebenen generieren. Diese umfassen min- 
destens die folgenden: 

(1) Grundlegende ‚Building Blocks’ von situierter Interaktion mit ihren je 
verschiedenen Konstellationen des Zusammenspiels kommunikativer 
Ressourcen zu ‚multimodal packages’ in Relation zu spezifischen Inter- 
aktionsaufgaben, Beteiligtenstrukturen, Teilnehmerinterpretationen und 
dynamisch-kontingenten Interaktionssituationen (Fokus in diesem Text), 

(2) Theorien und Konzepte von Interaktion, 

(3) sozio-technische Konstellationen, 

(4) menschliche Sozialität und moralische Ordnungen insbesondere in tech- 
nikbezogenen Situationen (vgl. Pitsch 2020), 

(5) Integration neuer Technologien in die Alltagsökologie ihrer Nutzer und 
damit verbundene gesellschaftliche Fragen (vgl. Kramer et al. 2013). 


Diese Erkenntnisse können nicht nur durch die Auswertung der Daten aus einer 
Studie zur Mensch-Roboter-Interaktion im Labor oder in der realen Welt gewon- 
nen werden. Vielmehr betrifft der Ansatz, Mensch-Roboter-Interaktion als metho- 
disches Instrument der Interaktionalen Linguistik einzusetzen, grundsätzlich 
alle Etappen eines iterativen Forschungsprozesses (s. Abb. 1 unten). Denn durch 
den interdisziplinären Zuschnitt dieses Unterfangens — bei dem Fragestellungen 
und Herausforderungen aus verschiedenen Disziplinen an einem gemeinsamen 
Gegenstand zusammentreffen - kann die konversationsanalytische Interaktions- 
forschung aufgrund ihrer Expertise in multimodaler Kommunikation und sozia- 
ler Interaktion einen Beitrag zur Gestaltung der kommunikativen Kompetenzen 
der technischen Systems leisten. 
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Abbildung 1: Mensch-Roboter-Interaktion als methodisches Instrument für die Erforschung von 
Kommunikation - iterativer Forschungsprozess 


Dieser Zuschnitt betrifft (i) Erkenntnisse über kommunikative Verfahren und 
multimodale Ressourcen, die als Inspiration für insbesondere (ii) die interaktio- 
nale wie möglicherweise auch (iii) die technische Modellierung von Interaktions- 
fähigkeiten dienen können,’ und auf (iv) der Implementierung in einem Roboter- 
System basierend (v) die Durchführung einer Studie zur Mensch-Roboter-Inter- 
aktion sowie (vi) die Auswertung der Daten, die entweder als Evaluation der im- 
plementierten Verfahren oder explorativ im Hinblick auf in der Situation neu zu 
entdeckende Phänomene erfolgen kann. Eine derartige Integration konversati- 
onsanalytischer Methoden, Konzepte und Erkenntnisse in den gesamten For- 
schungsprozess der Social Robotics hat gleichzeitig auch Auswirkungen auf ihre 
Arbeitsweise. Durch das Ziel der Modellierung entstehen neue methodische Her- 
ausforderungen für die Konversationsanalyse: Es werden neue Formen der Sys- 
tematisierung und der Reduktion von interaktiver Komplexität notwendig, die 
für technische Disziplinen anschließbar sind. Dafür ist eine Kombination von 
qualitativen mit quantifizierenden Verfahren hilfreich;? und Videoaufzeichnun- 
gen von Interaktionsverhalten sind durch von technischen Systemen gut aus- 


2 Die grundlegende Unterscheidung zwischen interaktionaler und technischer Modellierung 
basiert auf der inspirierenden Diskussion der Autorin mit S. Wrede im gemeinsamen Projekt. 

3 Die Quantifizierung kann auf unterschiedlichen Ebenen ansetzen und ist künftig weiter in ih- 
ren verschiedenen Aspekten zu detaillieren. So sind z.B. Kenntnisse über die Häufigkeit des Auf- 
tretens eines Verfahrens im Vergleich zu anderen (vgl. Schegloff 1993) hilfreich, um sich - aus 
Sicht einer an einem funktionierenden technischen System interessierten Robotik - mit den 
dringlichsten Problemen zu beschäftigen oder — aus konversationsanalytischer Perspektive — 
häufig latent vorhandene Quantifizierungen auf eine nachprüfbare Basis zu stellen. Auf eine se- 
quenzielle Beschreibung zielend, kann das Aufdecken von „Interactional Paths“ und die Quan- 
tifizierung ihrer einzelnen Schritte (ohne die Grundidee der sukzessiven lokalen Aushandlung 
zu negieren) Hinweise auf die Robustheit eines Phänomens liefern (vgl. Pitsch et al. 2014a). Kor- 
relationen verschiedener interaktionsinterner und -externer Parameter können neue, über rein 
konversationsanalytisch Rekonstruktionen hinausgehende Perspektiven eröffnen (vgl. Stivers 
2015). 
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wertbare Datenformate zu ergänzen, wie z.B. Motion-Capture-Verfahren oder 
Eye-Tracking (vgl. Pitsch et al. 2014). Damit gewinnt die Konversationsanalyse 
nicht nur neue methodologische Impulse und den Zugriff auf bisher kaum ver- 
füg- und integrierbare Datenformate, sondern sie erhält auch die Möglichkeit, 
ihre bisherigen Erkenntnisse in einen semi-experimentellen Forschungsprozess 
zu integrieren. Durch die Implementierung von interaktiven Verfahren als kleine, 
lokale ‚Building Blocks‘ kann z.B. das genaue Zusammenspiel verschiedener 
kommunikativer Ressourcen unter definierten Bedingungen erforscht und/oder 
die Robustheit aus menschlicher Interaktion bekannter Verfahren für den Kon- 
text der Mensch-Maschine-Konstellation überprüft werden. Die in einem solchen 
Prozess erarbeiteten Ergebnisse können wiederum - im Sinne eines iterativen 
Forschungsdesigns - als Ausgangspunkt für neue Fragestellungen, veränderte 
Modellierungen oder erweiterte Studiendesigns sowohl in menschlicher Kommu- 
nikation als auch in sozio-technischen Konstellationen dienen. 

Diese Herangehensweise wurde in Auseinandersetzung mit drei verwandten, 
sich in ihren Details unterscheidenden Ansätzen entwickelt, die jeweils einzelne 
Aspekte eines solchen Ansatzes beleuchten. 

Zum einen schlagen Yamazaki et al. (2007, 2010) und Kuno et al. (2007) - 
soweit ich sehe - als erste einen interdisziplinären, inkrementellen Ansatz zur 
Mensch-Roboter-Interaktion vor, in dem (a) menschliche Interaktion mit ethno- 
graphischen und konversationsanalytischen Methoden untersucht wird, (b) auf 
den gewonnenen Erkenntnissen basierend ein Roboter-System entwickelt wird 
und (c) der Austausch zwischen Mensch und Roboter untersucht sowie im Hin- 
blick auf dessen Fffizienz evaluiert wird, um anschließend die Entwicklung des 
Roboter-Systems zu verfeinern (Yamazaki et al. 2007: 72). 

Zum zweiten entwickeln Pitsch et al. (2013, 2014a) einen Ansatz, in dem Vi- 
deoaufzeichnungen aus einer semi-experimentellen Studie zum ‚Tutoring‘ in El- 
tern-Kind-Interaktion mit dem Ziel untersucht werden, daraus Erkenntnisse für 
die Entwicklung eines (in Zukunft: lernenden) Robotersystems zu gewinnen. Da- 
bei wird in einem ersten Schritt in einer auf multimodaler Konversationsanalyse 
basierenden Analyse der interaktive Zusammenhang von Blickpraktiken des Kin- 
des und manipulativen Tätigkeiten des Erwachsenen herausgearbeitet, wobei 
zur Visualisierung der Bewegungstrajektorien zusätzlich ein Motion-Capture- 
Verfahren in die Analyse einbezogen wird. Die so in explorativer Analyse gewon- 
nenen Erkenntnisse werden in einem zweiten Schritt in ein hypothesengeleitetes 
Verfahren überführt, in dem mit mathematischen Methoden eine Korpusanalyse 
und Hypothesenprüfung durchgeführt wird. In einem dritten Schritt werden die 
so herausgearbeiteten interaktiven Zusammenhänge als Inspiration für die Mo- 
dellierung von Roboterverhalten genutzt, dessen Umsetzung in einer Studie zur 
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Mensch-Roboter-Interaktion mit qualitativen (Pitsch et al. 2013) wie quantifizie- 
renden Methoden (Vollmer et al. 2014) untersucht wird. Während in diesem An- 
satz im Vergleich zum von Yamazaki et al. (2007, 2010) vorgeschlagenen Verfah- 
ren insbesondere die Möglichkeiten und Implikationen der Integration von kon- 
versationsanalytischen Methoden in andere methodologische Zugänge erprobt 
wird, liegt der Fokus hinsichtlich des Roboterverhaltens auf der Frage, wie der 
Roboter möglicherweise das Verhalten des menschlichen Nutzers durch seine ei- 
genen Handlungen beeinflussen kann. Die Frage nach den interaktiven Anschluss- 
möglichkeiten vonseiten des Roboter-Systems wird hier nicht explizit gestellt. 
Diese nächste Komplexitätsstufe des Erforschens von ‚Building Blocks‘ sequen- 
zieller Handlungsstrukturen wird anschließend - im Rahmen der diesem Aufsatz 
zugrundeliegenden Projekte - betrachtet, und zwar dergestalt, dass der Roboter 
nicht nur den ‚first turn‘ übernimmt, sondern prinzipiell im ‚third turn‘ auch an 
die kommunikativen Angebote des Menschen (‚second turn‘) anschließen muss 
(Pitsch 2016, Pitsch et al. 2016). 

Zum dritten fokussiert Fischer (2016) auf die Rolle des Roboters innerhalb ei- 
ner Mensch-Roboter-Studie. Sie schlägt vor, Roboter als „interactional confeder- 
ates“ zu verstehen, deren Vorteil darin bestehe, „reliable“ und „controllable“ (3) 
zu sein und „to behave exactly in the way programmed and identically for each 
participant“ (4). Damit lassen sich möglicherweise Aspekte der von Kuhlen & 
Brennan (2013) angeführten Schwierigkeiten von Confederates bearbeiten, aller- 
dings erscheint diese Sicht - zumindest beim aktuellen Stand autonomer Robo- 
tersysteme — noch stark idealisiert und mit praktischen wie konzeptuellen 
Schwierigkeiten verbunden: Unsicherheiten in der Perzeption der Umwelt er- 
schweren die Präzision in den Kontrollmöglichkeiten; fest vorprogrammierte 
Strukturen erschweren das interaktive ‚fitting‘; und Wizard-of-Oz-Ansätze (Riek 
2012) sind unter Umständen nicht unmittelbar auf autonome Systeme anwend- 
bar. 

Insgesamt erweitert unser Ansatz‘ also die erste und zweite Forschungsper- 
spektive an verschiedenen Stellen. Mit der Idee, interaktive Verfahren im Robo- 
terverhalten zu implementieren und sie anschließend in einer Studie zur Mensch- 
Roboter-Interaktion zu erproben, verstehen wir ebenfalls einen Roboter als „in- 
teractional confederate“, wobei wir allerdings dessen Manipulierbarkeitin Teilen 
etwas kritischer betrachten. 


4 Eine frühe Version haben wir ab 2012 in den Projektskizzen „Interaktion & Raum“ und „Incre- 
mental Coordination in Human-Robot-Interaction“ beschrieben und auf diversen Konferenzen 
vorgestellt. In vorliegenden Form wurde sie insbesondere auf dem Workshop „Interacting with 
Robots and Social Agents?“ auf der „Mensch & Computer“ (MuC) 2019 präsentiert. 
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4 Referenzielle Praktiken und Lokal-Deixis 


Für die Umsetzung des Ansatzes, Mensch-Roboter-Interaktion als Instrument für 
die multimodale Interaktionsforschung zu verwenden, betrachten wir im Folgen- 
den das Phänomen des Verweisens auf Objekte. Solche referenziellen Praktiken 
stellen eine grundlegende Aufgabe in sozialer Interaktion dar, deren linguisti- 
sche, interaktionale und multimodale Dimension in den letzten Jahren für 
menschliche Face-to-face-Interaktion ausbuchstabiert worden ist. Für die intra- 
personelle Koordinierung zwischen Sprache und Gestik gilt als grundlegendes 
Prinzip, dass die Geste dem „lexical affiliate“ zeitlich vorangeht (Schegloff 1984). 
Das Design der Zeigegesten orientiert sich am Interaktionspartner, sie werden 
„produced and timed with respect to the activities of the co-participants, such 
that they are in a position to be able to see the pointing gesture in the course of 
its production“ (Hindmarsh & Heath 2000). Für dieses Prinzip wird von Mondada 
(2012) anhand von französisch-sprachigen Daten eine systematische multimo- 
dale - Sprache, Gestik und Blick involvierende - Praktik beschrieben, in der das 
lokal-deiktische Pronomens „ici“ in Kombination mit einer Zeigegeste entweder 
zur Einführung eines neuen Referenten (bei einem aufmerksamen Interaktions- 
partner) oder zur Aufmerksamkeitsorientierung eines (aktuell anderweitig orien- 
tierten) Interaktionspartners dient. Diese Dimensionen zusammenführend, 
schlägt Stukenbrock (2015) ein Set von Parametern vor, anhand dessen sich sol- 
che lokal-deiktische Handlungen systematisch beschreiben lassen: Fokussierte 
Interaktion, Körper, deiktischer Ausdruck, Zeigegeste, Suchraum, Ziel, Referen- 
ten, Reziprozität der Wahrnehmung, Display von Verstehen. Da in deiktischen 
Praktiken die Aufmerksamkeitsfokussierung der Beteiligten eine zentrale Rolle 
spielt, beginnt Stukenbrock (2018) die Rolle des Blicks innerhalb dieser Verfah- 
ren mittels mobiler Eye-Tracking Brillen detaillierter zu untersuchen. Diese Stu- 
dien zeigen zum einen die multimodale und interaktive Komplexität des Phäno- 
mens ‚referenzielle Praktiken‘ auf, bieten erste Hinweise auf das systematische 
Zusammenspiel der verschiedenen kommunikativen Ressourcen und verdeutli- 
chen zum anderen auch gleichzeitig die Dynamik und Flexibilität von Interakti- 
onsbeteiligten in ihrer Orientierung an den situativen Kontingenzen. Offen bleibt 
aber die Frage, wie sich das Zusammenspiel der multimodalen kommunikativen 
Ressourcen in der interaktiven Praxis weiter ausbuchstabieren lässt in Bezug auf 
die dynamische Formierung von ‚multimodal packages‘, die Funktionen der ein- 
zelnen Ressourcen und ihre Interpretation durch die Rezipienten. Welche Funk- 
tionen übernehmen z.B. jeweils Blick bzw. Geste im Rahmen des multimodalen 
Zusammenspiels? 
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Der Bedarf systematischer Beschreibungen zeigt sich insbesondere dann, 
wenn ein Modell referenzieller Praktiken für einen Roboter entwickelt bzw. im- 
plementiert werden soll. Studien im Bereich der Social Robotics zeigen zwar, dass 
kombinierte ‚Kopf-und-Armbewegungs‘-Strategien des Roboters erfolgreicher 
sind als die Verwendung einzelner Modalitäten (St. Clair et al. 2011) und orientie- 
ren sich für die Bestimmung der Haltedauer einer Zeigegeste an mittleren Werten 
von menschlichen Interaktionsbeteiligten in einem vergleichbaren Szenario 
(Huang & Mutlu 2012). Aber auf der Basis dieser Informationen lassen sich nur 
schwerlich referenzielle Praktiken für einen Roboter modellieren. Pitsch et al. 
(2014b) erproben eine individualistische Modellierung der referenziellen Prakti- 
ken für einen Museumsroboter in interaktivem Kontext und zeigen daran dessen 
Grenzen aufund formulieren erste Implikationen für nächste Schritte in Richtung 
eines interaktiven Zugangs. Insgesamt besteht also neben Kenntnissen zum kon- 
kreten Zusammenspiel der multimodalen Ressourcen auch ein Desiderat bezüg- 
lich der interaktiven Dimension, der Rolle des Interaktionspartners und der situ- 
ativen Anpassungsleistungen für die systematische Modellierung von referen- 
ziellen Praktiken für ein Roboter-System. 


5 Studien: Roboter, Design des Verhaltens, Daten 


An die beschriebenen Kenntnisse und Desiderate zur Beschreibung referenzieller 
Praktiken anknüpfend, haben wir in einer Reihe aufeinander aufbauender Stu- 
dien deiktische Praktiken in einem humanoiden Roboter (Nao) implementiert 
und erprobt. Der Roboter agiert in der Rolle eines Museumsguide und bietet vor- 
beikommenden Besuchern zunächst an, in ein „Focused Encounter“ einzustei- 
gen, dann Informationen zu mehreren Exponaten zu geben und schließlich das 
Encounter wieder zu beenden. Im Rahmen der Exponatserläuterungen wurden 
jeweils verschiedene Situationen des Herstellens von Referenz auf ein Objekt in- 
tegriert, die jeweils spezifische räumliche Konstellationen und Beteiligungsfor- 
men bieten. 


5.1 Robotersystem 


Für die Durchführung der Studien wurde eine humanoide Roboter-Plattform aus- 
gewählt, die nicht nur im Forschungslabor, sondern insbesondere auch im „real 
world“-Kontext des Museums einsetzbar ist. D.h. sie soll sowohl freundlich auf 
die Besucher wirken als auch transportabel, robust, bezahlbar und in der Com- 
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munity gut verortet sein. Daher fiel die Wahl auf einen Roboter des Typs NAO 
(Aldebaran, version 3+), der konstant über die verschiedenen Studien hinweg 
eingesetzt wurde. Erst 2017 wurden für eine weitere Studie die vorhandenen Ele- 
mente auf einen Roboter des Typs Pepper übertragen. Um die Größe des NAO 
(52 cm) für die Interaktionsstudien zu kompensieren, wurde der Roboter im Aus- 
stellungsraum auf einem Tisch positioniert. Nach einer ersten höhenverstellba- 
ren Tischversion mit kleiner Grundfläche wurde eigens für den Roboter ein Tisch 
angefertigt, der sowohl Laufbewegungen des Roboters ermöglicht als auch - für 
den Fall von technischen Komplikationen - eine Auffangmöglichkeit für den Ro- 
boter integriert, um nicht Gefahr zu laufen, möglicherweise im Museum Exponate 
zu beschädigen. 

Das Roboter-System ist so programmiert, dass es im Museum (s. Studien 1 
und 2) autonom agiert. Es ist mit einer basalen Middleware-Architektur ausge- 
stattet, die dezidierte modulare Systemkomponenten (z.B. Personen-Tracking, 
Spracherkennung, Dialog u.a.) verbindet. Die Handlungsabfolge des Roboters 
folgt einem prädefinierten Ablauf-Skript, bei dem die einzelnen Phasen durch Fi- 
nite State Automaten (mit sich entwickelnder Fein-Granularität) modelliert wur- 
den. 

Studie 1: In der hier verwendeten ersten Version des Roboter-Systems ist die 
Perzeption ausschließlich visuell (ohne Spracherkennung) mittels eines exter- 
nen infrarotbasierten Motion-Capture-Systems (Vicon) realisiert. Hierfür wurden 
Infrarot-Kameras unter der Decke des Museumsraums installiert, mittels derer 
die Position im Raum, Bewegung und Ausrichtung der Besucher detektiert, auf 
einem externen PC verarbeitet und als Personen-Informationen an die Software 
des Roboter-Systems übergeben. Damit die Besucher vom Motion-Capture-Sys- 
tem detektiert werden können, wurden sie vor dem Betreten des Raums mit (bis 
zu maximal fünf) Mützen ausgestattet, auf denen jeweils mehrere Vicon-Marker 
in einem spezifischen Muster angeordnet waren. Dieses Verfahren wurde ver- 
wendet, um zum einen die Bewegung der Besucher im Raum als Teil des Daten- 
Korpus mit aufzeichnen zu können und zum anderen als initiale ‚Abkürzung‘ für 
künftige, mit den Bordmitteln des Roboters zu realisierende Perzeptionskompo- 
nenten. Gleichzeitig hat die Integration des Vicon-Systems zu zwei unbeabsich- 
tigten, aber für die Interaktionsforschung fruchtbaren Konstellationen geführt: 
(a) Zeitverzögerung in der Verarbeitung der Daten, was zu unbeabsichtigt langen 
Pausen zwischen verschiedenen Roboter-Aktivitäten führt; (b) Lokalisierung der 
Personen mit einer leichten seitlichen Abweichung, was zu spezifischen Dynami- 
ken in der Beteiligungsstruktur der Besucher führt. 

Studie 2: In dieser Version des Roboter-Systems wird für die visuelle Perzep- 
tion die roboter-interne VGA-Kamera des NAO verwendet. Zusätzlich wurde ein 
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externes Mikrophon unterhalb des Roboter-Tischs platziert, dessen Daten für die 
Spracherkennung per Keyword-Spotting genutzt wird (vgl. Pitsch et al. 2016). 


5.2 Design der referenziellen Praktiken 


Das Design der im Roboter implementierten referenziellen Praktiken orientiert 
sich an interaktionsanalytischen Erkenntnissen (s. Kap. 3) und Konzepten inter- 
aktiver Koordinierung. Insbesondere sind hierbei zentral das Konzept der „mul- 
timodal packages“ (Goodwin, Mondada), die Beobachtung zur intrapersonellen 
Koordinierung derzufolge „the gesture precedes the lexical affiliate“ (Schegloff 
1984) sowie die Orientierung am Interaktionspartner (Hindmarsh & Heath 2000). 
Gleichzeitig müssen die — zum Zeitpunkt der jeweiligen Studie aktuellen — Mög- 
lichkeiten der technischen Realisierung berücksichtigt und in das Design der re- 
ferenziellen Praktiken einbezogen werden. Dieses führt einerseits zu Limitierun- 
gen im Design, befördert andererseits aber die Beobachtung spezifischer interak- 
tiver Dynamiken. 

Studie 1: Im Rahmen der vorprogrammierten Museumsführung wurden drei 
verschiedene räumlich-situative Konstellationen von deiktischer Referenz auf 
ein Exponat integriert (s. Pitsch et al. 2014). In der im Folgenden näher betrach- 
teten Konstellation verweist der Roboter auf ein Exponat, das sich auf der gegen- 
überliegenden Seite des Raumes befindet (s. Abb. 2, P6). Durch die vorangehen- 
den Erklär-Aktivitäten des Roboters werden zudem Bedingungen hergestellt, 
unter denen die Aufmerksamkeit der Besucher in etwa in Richtung des Roboters 
ausgerichtet sein dürfte. 


Abbildung 2: Setting (1) Abbildung 3: Beispiel „Walther Dahn“ 


Die deiktische Referenz des Roboters wurde als „multimodal package“ mit den 
folgenden Eigenschaften definiert (s. Abb. 3): 
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(a) Intrapersonelle Koordinierung von Sprache und Gestik des Roboters: 
Zu Beginn der Äußerung wird ein lokaldeiktischer Ausdruck („dort vorne“) mit 
einer Zeigegeste kombiniert, deren Onset leicht dem verbalen Ausdruck voran- 
geht (s. Schegloff 1984). Hierauf folgt die Benennung des Referenten („das loch 
im bild von walther dahn“) währenddessen der Peak der Zeigegeste gehalten 
wird. Mit Ende der verbalen Äußerung wird auch die Geste in ihre Home-Position 
zurückgeführt. 

(b) Kopforientierung des Roboters richtet sich dynamisch an der räum- 
lichen Position der Besucher aus: Die technischen Möglichkeiten des Motion- 
Capture-Systems nutzend, ist der Roboter so programmiert, dass er seinen Kopf 
jeweils dynamisch auf die sich verändernde Position des dem Roboter am nächs- 
ten stehenden Besuchers ausrichtet. Aus technischen Gründen musste dieses als 
ein permanent mitlaufendes Verhalten realisiert werden, so dass sich die Steue- 
rung der Kopforientierung nicht in die Gestaltung der ‚multimodal packages‘ in 
Situationen lokal-deiktischer Referenz integriert werden konnte. Diese getrennte 
Verarbeitung von Sprache/Gestik und Kopforientierung führt zu einer experi- 
mentellen Situation, in der Blick und Geste des Roboters - je nach der von den 
Besuchern eingenommenen Position im Raum - während der Deixis voneinander 
dissoziiert sein können. 

Studie 2: Analog zur ersten Studie wurden auch bei Studie 2 drei verschie- 
dene räumlich-situative Konstellationen von deiktischer Referenz auf ein Expo- 
nat in die Erläuterungen des Roboters integriert (s. Pitsch et al. 2016). In der im 
Folgenden näher betrachteten Konstellation verweist der Roboter auf ein Expo- 
nat zu seiner rechten Seite (s. Abb. 4, EX-1). Auch hier wurden durch die voran- 
gehende Interaktion Bedingungen hergestellt, unter denen die Aufmerksamkeit 
der Besucher initial primär auf den Roboter ausgerichtet ist. 


drüben könnt ihr sehen auf der sparrenburg gewohnt hat 


Verb | dort 


Verb 


dort drüben | auf dem großen bild 


Abbildung 4: Setting (2) Abbildung 5: Beispiel „Auf der Sparrenburg“ 


Im Vergleich zu Studie 1 bestehen die zentralen Unterschiede im Design der deik- 
tischen Referenz des Roboters in den folgenden Aspekten: 
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(a) Kopforientierung des Roboters als Teil des ‚multimodal package‘: 
Durch die veränderten technischen Bedingungen kann nun die Kopfausrichtung 
des Roboters als integrierter Bestandteil in der Gestaltung der ‚referenziellen 
Praktik‘ mitmodelliert werden. 

(b) Monitoring und Repair: Entsprechend des zugrundeliegenden Ansatzes 
der interaktiven Koordinierung ist das Verhalten des Roboters so gestaltet, dass 
er das Verhalten der Besucher beobachtet, dieses im Hinblick auf Erfolg bzw. 
Misserfolg seiner deiktischen Referenz bewertet und ggf. einen zweiten Verweis 
auf das Exponat (d.h. ein Repair) anbietet. 

(c) Design der referenziellen Praktiken - Upgrade in der zweiten Ver- 
sion: Beim ersten deiktischen Verweis zeigt der Roboter per Armgeste auf das 
Exponat, während der Kopf auf die Besucher ausgerichtet ist (analog zu Studie 
1). Diese Dissoziation der Ressourcen ist erforderlich, damit der Roboter - dessen 
Kamera frontal im Roboterkopf eingebaut ist — die Reaktionen der Besucher be- 
obachten kann. Der (wenn notwendig) zweite Verweis auf das Exponat, d.h. eine 
Reparatur, ist als Upgrade gestaltet: Der Roboter zeigt per Armgeste auf das Ex- 
ponat und wendet ebenfalls parallel dazu seinen Kopf dorthin (s. Abb. 5). 


5.3 Studien & Daten: Roboter als Museumsguide 


Im vorliegenden Text werden Daten aus zwei (von fünf sukzessive aufeinander 
aufbauenden) Studien verwendet. 

Studie 1: Studie 1 wurde im Jahr 2010 in einem Kunstmuseum durchgeführt 
(Pitsch et al. 2014b). Als Teilnehmer der Studie wurden reguläre Museumsbesu- 
cher rekrutiert, die in einem Vorraum des Museums vom Forscherteam angespro- 
chen wurden. Sie wurden darüber informiert, dass im Nachbarraum eine wissen- 
schaftliche Studie stattfindet, sie - beim Betreten des Raumes - mittels Videoka- 
meras und eines Motion-Capture-Systems aufgezeichnet würden und gebeten ei- 
nen Hut mit Vicon-Markern für diese Zeit aufzusetzen. Weitere Informationen zu 
Art und Inhalt der Studie wurden ihnen nach der Teilnahme erläutert sowie ihre 
schriftliche Einwilligung eingeholt (andernfalls wurden die Aufnahmen ge- 
löscht). Dementsprechend bestehen die Studienteilnehmer vornehmlich aus 
Kleingruppen von Erwachsenen. Die Begegnungen zwischen Roboter und Besu- 
chern dauerten ca. 3 Minuten, wobei 220 verschiedene Durchläufe aufgezeichnet 
wurden. Diese wurden mittels zwei bzw. drei Videokameras und Motion-Capture- 
Verfahren (Vicon) aufgezeichnet. 

Studie 2: Studie 2 fand im Jahr 2014 in einem Historischen Museum (Pitsch 
2016, Pitsch et al. 2016) im Rahmen eines Wissenschaftsfestivals statt, in dessen 
Programmheft der Museumsroboter im Historischen Museum angekündigt wur- 
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de. Die Teilnehmer der Studie sind dementsprechend vornehmlich Kleingruppen 
bestehend aus Kindern und Eltern, die aufgrund eines spezifischen Interesses an 
Technik/Robotern ins Museum gekommen sind. Auch hier wurden die Besucher 
im Vorraum des Museums vom Forscherteam begrüßt, sie über das Stattfinden 
einer wissenschaftlichen Studie informiert und ihre schriftliche Einwilligung ein- 
geholt. Erläuterungen zu Art und Zielen der Studie wurden ihnen im Anschluss 
an die Studienteilnahme angeboten, wofür Mitglieder des Forschungsteams be- 
reitstanden. Die Begegnungen zwischen Roboter und Besuchern dauerten ca. 4 
Minuten, wobei 72 verschiedene Durchläufe mittels vier Videokameras und zwei 
externen (nicht mit dem Roboter-System verbundenen) Motion-Capture-Kameras 
(Kinect) aufgezeichnet wurden. 


6 Umgang mit deiktischen Angeboten des 
Roboters 


In einem ersten Schritt (Studie 1) wird anhand von zwei Fallanalysen der Frage 
nachgegangen, wie die Museumsbesucher mit den kommunikativen Angeboten 
des Roboters spontan in einem alltagsweltlichen Setting umgehen. Wie behan- 
deln sie in einer solchen sozio-technischen Konstellation die referenziellen Ver- 
weise des Roboters? Welche Hinweise lassen sich auf das Zusammenspiel der 
kommunikativen Ressourcen - unter den Bedingungen dieser sozio-technischen 
Konstellation — erkennen? Welche Implikationen lassen sich aus diesen Beo- 
bachtungen für die weitere Entwicklung der Interaktionskompetenzen für das 
technische System ableiten? 


6.1 Parallelität von Kopfausrichtung und Zeigegeste - 
Sukzessive Lokalisierung (Fallanalyse 1) 


Untersuchen wir ein erstes Beispiel (Studie 1, VP 222), in dem zwei Besucher die 
referenziellen Orientierungsangebote des Roboters unmittelbar befolgen und sich 
erfolgreich auf das Exponat hin orientieren. Dabei folgen sie den Angeboten des 
Roboters kleinschrittig und zeigen sich wechselseitig ihre jeweils aktuellen Inter- 
pretationen der Roboter-Aktivitäten auf. 

(a) Deiktische Referenz - Parallelität von Kopfausrichtung und Zeigege- 
ste (R): Zu Beginn des hier interessierenden Ausschnitts sind eine Besucherin 
(B1) und ein Besucher (B2) körperlich in Richtung des Roboters bzw. des Expo- 
nats P3 ausgerichtet (#02:11:40). Der Kopf des Roboters ist in ihre Richtung wie 
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auch auf ein einige Meter hinter ihnen an der Wand hängendes Bild (P6, Walther 
Dahn) ausgerichtet. Der Roboter äußert die Frage „haben sie dort VORne schon 
das LOCH im bild von walther DAHN gesehen, “, die durch eine Zeigegeste in Rich- 
tung der Besucher und des Exponats P6 begleitet wird (Z. 01-02, #02:12:56). 


01 R-ver: |haben sie dort VORne schon das LOCH 
R-gaz: |@P6/B1/B2 
R-ges: |pt@P6-onset |pt@P6-peak 
|#02:11:40 |#02:12:56 


02 R-ver: im bild von walther DAHN gesehen, | 
R-ges: .. | 


02:11:40 02:12:56 


(b) Behandlung als Frage-Antwort-Sequenz (B2): B2 beantwortet die Frage des 
Roboters mit „NEIN;“ (03) und etabliert damit auf gesprächsstruktureller Ebene 
eine Frage-Antwort-Sequenz. 


03 R-ver: (1.0) |(1.0) 
R-ges: .. | 
B2-ver: |NEIN; | 


(c) Sukzessive Lokalisierung des Referenten (B1): B1 hingegen behandelt die 
Äußerung des Roboters als Aufforderung, sich auf die bezeichnete Referenz hin 
zu orientieren. Sie dreht sich um 180° in die durch Geste und Kopf angezeigte 
Richtung zu P6 (#02:17:32), wendet ihren Kopf kurz zu P1 (#02:17:68), wieder zu- 
rück zu P6 (#02:18:28) und zeigt schließlich auf P6 (#02:18:72). Damit wird ihr 
Versuch sichtbar, die multimodale Referenz des Roboters aufzulösen, d.h. suk- 
zessive das Zeigeziel in ihrer ‚domain of scrutiny‘ zu verorten und inhaltlich zu 
interpretieren. Dieser Vorgang wird gerahmt als soziales Ereignis, indem die In- 
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terpretationsschnitte für B2 sichtbar durchgeführt werden und schließlich B1 und 
B2 gemeinsam zum Exponat (P6) schreiten (#02:22:00). 


03 R-ver: (1.0) |(1.0) 
R-ges!: .. | 
B2: |NEIN; | 
B2-act: |(turns round) | 
B2-gaz: |@P6 
Bi-act: (turns round) | 
B1-gaz: | @6P 


|#02:17:32 |#02:17:68 |#02:18:28 


04 R-ver: Jauch das ist ein |stilmittel |der mühlheimer freiheit 
R-ges: |pt@P6-retr | 
Bl-act: | (pt>P6) | 
|#02:18:72 |#02:22:00 


02:18:72 


02:18:28 


02:22:00 


Insgesamt deckt dieses Beispiel nicht nur auf, dass die Besucher auf die referen- 
ziellen Angebote des Roboters reagieren, sondern auch wie sie schrittweise den 
Orientierungshinweisen folgen, aktiv und als soziale Praktik gestaltet daran ar- 
beiten, den designierten Referenten zu etablieren. 
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6.2 Dissoziation von Kopfausrichtung und Geste - Rückorien- 
tierung zum Roboter (Fallanalyse 2) 


Während im ersten Beispiel relativ einfache strukturelle Bedingungen gegeben 
sind - Parallelität von Kopfausrichtung und Geste des Roboters; räumliche Kons- 
tellation, in der beide Besucher und das designierte Exponat in einer Fluchtlinie 
stehen - ermöglicht ein zweites, komplexeres Beispiel (Studie 1, VP 043) eine 
weitere Ausdifferenzierung der referenziellen Praktiken, des Zusammenspiels der 
kommunikativen Ressourcen sowie ihre interaktiven Implikationen. Der zweite 
Fall bietet eine leicht veränderte Konstellation: Kopfausrichtung und Geste des 
Roboters weichen leicht voneinander ab; und zwei Besucherinnen (B1, B2) stehen 
mit ca. 1 m Abstand zueinander, d.h. in der Fluchtlinie zu unterschiedlichen Ex- 
ponaten. 

(a) Aufmerksamkeitsorientierung und Relevantsetzung der Ressource 
‚Blick‘ (R): Wenn wir in die Situation einsteigen, sind die beiden Besucherinnen 
teils auf den Roboter, teils auf die Exponate P3 (B1) und P2 (B2) orientiert. Der 
Kopf des Roboters (R) ist in Richtung B2 bzw. des Exponats P1 (#02:38:00) orien- 
tiert, dann wechselt die Kopforientierung kurz in Richtung B1 (#02:39:80) und - 
parallel zum Beginn des verbal-gestischen Verweises auf P6 (Z. 01) - zurück zu 
B2 bzw. P1 (#02:41:76). Auf technischer Ebene ist diese wechselnde Kopforientie- 
rung des Roboters dadurch motiviert, dass sich das System jeweils dynamisch auf 
die (aus technischer Sicht) am nächsten zum Roboter stehende Person ausrichtet, 
wobei die Orientierung systematisch nach rechts abweicht (s.o.). Auf Interakti- 
onsebene setzt diese wechselnde Kopforientierung — von Exponat P1 zu den Be- 
sucherinnen und zurück zu P1 - beim Beginn des referenziellen Verweises die 
Ressource ‚Blick‘ relevant. Mindestens für B1 ist dieses aufgrund ihrer körperli- 
chen Ausrichtung wahrnehmbar. 


01 R-ver: |haben sie dort VORne |schon |das LOCH 
R-gaz: @P1 |@V2 [@PE 2.222.222: 2: 
R-ges: |pt@P6-onset |pt@P6-peak ............ 
Vi-gaz: |@P3 |@R 
V2-gaz: |@P2 >>>>>> |@R 
|02:38:00 |02:41:76 |02:43:92 


02:39:80 
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(b) Deiktische Referenz - Dissoziation von Kopfausrichtung und Geste (R): 
Der Verweis auf das Exponat „haben sie dort VORne schon das LOCH im bild von 
walther DAHN gesehen,“ (Z. 01-02) wird von B1 und B2 sukzessive mitvollzogen. 
Im Anschluss an das verbale und per Zeigegeste begleitete Orientierungsangebot 
„dort VORne“ wenden B1 und B2 ihre visuelle Aufmerksamkeit auf den Roboter 
(#00:43:92). Nach der inhaltlichen Präzisierung („LOCH im bild von walther 
DAHN“) versuchen sie sukzessive den Referenten zu lokalisieren: B2 dreht sich 
im Uhrzeigersinn zunächst zu P6 (d.h. dem Bild von Walther Dahn an der gegen- 
überliegenden Raumseite) und dann weiter zu P1, auf dem ihr Blick schließlich 
ruhen bleibt. B1 dreht sich gegen den Uhrzeigersinn zunächst zu P1 (#02:46:96), 
dann weiter in Richtung P6 (02:48:40). Diese sukzessiven Re-Orientierungen zwi- 
schen P1 und P6 als mögliche Referenten spiegeln den Umstand wider, dass die 
Zeigegeste des Roboters auf P6 verweist (Bild von Walter Dahn), wohingegen des- 
sen Kopfausrichtung - entsprechend der technisch bedingten leicht versetzten 
Orientierung auf B2 - in Richtung auf P1 geht. Hier werden also die kommunika- 
tiven Ressourcen Kopforientierung/Blick und (Zeige-)Geste in der Verkörperung 
des Roboters voneinander dissoziiert, wobei sie auf unterschiedliche Objekte (P6 
vs. P1) im Ausstellungsraum verweisen. 


02 R-ver: im bild von walther DAHN gesehen, |(1.0) |(1.4) | 


R2GCSi ee es |pt@P6-retr | 
V1-gaz: >> |@P1 |@P6 |>> @P1 >> 
V2-gaz: >> |@P6|@P1 

|#02:46:96 


|#02:48:40 
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(c) Umgang mit Ambivalenz - Fehlorientierung (B2) vs. Re-Orientierung 
zum Roboter (B1): Diese Ambivalenz im Verweisraum des Roboters wird von den 
Besucherinnen unterschiedlich bearbeitet. B2s Blick bleibt (fälschlicherweise) 
auf P1 haften (02:49:76-a). B1 hingegen dreht sich zurück zum Roboter (02:49:76- 
a), wo weitere Disambiguierungshinweise prinzipiell erwartet werden könnten. 
Allerdings hat der Roboter zu diesem Zeitpunkt seine (korrekt auf P1 ausgerich- 
tete) deiktische Geste bereits wieder zurück in die Home Position (Sacks) geführt 
(02:49:76-b), so dass sie als (korrekter) Orientierungshinweis auf P6 nicht mehr 
für B2 zur Verfügung steht. Zur Orientierung bleibt also nur noch die Kopfaus- 
richtung des Roboters (02:49:76-b), der B2 konsequenterweise folgt und entspre- 
chend - wie auch B1 - fälschlicherweise das Exponat P1 betrachtet (02:50:56). 


03 R-ver: auch das ist ein stil|mittel der MUHLheimer freiheit | 
R gaže nd er ee | 
Vi-gaz: |@R........... >>|@P1 
V2EIQAZ Es et | 

#02:49:76-a/b |#02:50:56 

04 R-gaz: |@P6/V2 


02:49:76-b 


Insgesamt zeigt dieses Beispiel also, dass Besucher im Fall der Dissoziation von 
Kopforientierung und Geste Schwierigkeiten haben, den korrekten Referenten zu 
identifizieren. Gleichzeitig wird bezüglich der zeitlichen Struktur erkennbar, 
dass eine fixe, vorprogrammierte Dauer einer Zeigegeste kaum den Anforderun- 
gen von Situiertheit genügen kann. Dieses führt gleichzeitig zur Beobachtung ei- 
nes Alltagsverfahrens: Im Fall des Zweifels re-orientiert sich die Besucherin zum 
Roboter. 


6.3 Erste Beobachtungen und Implikationen 


Aus diesen Beobachtungen lassen die folgenden Ergebnisse festhalten und erste 
Implikationen für das Design referenzieller Praktiken ableiten: 
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(a) Interaktionale Relevanz von Orientierungshinweise des Roboters: 
Interaktionsbeteiligte reagieren auf die Orientierungshinweise des Roboters in 
seiner Rolle als Museumsführer. 

(b) Dissoziation der Ressourcen Blick und Geste: Es finden sich erste Hin- 
weise darauf, dass sich Interaktionsbeteiligte an einzelnen Aspekten bzw. Moda- 
litäten einer ‚kommunikativen Gestalt‘ orientieren. Dieses ist korpusbasiert wei- 
ter zu analysieren. 

(c) Praktik der Besucher: Im Fall der Ambivalenz und Unsicherheit, auf wel- 
ches Exponat vom Roboter verwiesen wird, findet sich eine Nutzer-Praktik ‚Re- 
Orientierung zum Roboter‘, von dem weitere Disambiguierungshinweise prinzi- 
piell erwartet werden könnten. 

(d) Dauer einer Zeigegeste: Da nicht in allen Details vorhersehbar ist, wann 
genau Nutzer auf den Roboter hin orientiert sind und folglich seine visuellen Ori- 
entierungshinweise wahrnehmen können, ist die erforderliche Haltedauer einer 
Zeigegeste schwer im Vorfeld definierbar. Sie allein in Relation zur verbalsprach- 
lichen Ebene der Deixis zu designen, greift zu kurz, vielmehr ist ein interaktiver 
Ansatz erforderlich. 

(e) Implikationen für das Design eines Building Blocks ‚referenzielle 
Praktik‘ - Explizitheit vs. Interaktivität: Aus diesen Beobachtungen ergeben 
sich als Implikation für das Design eines Building Blocks ‚referenziellen Prakti- 
ken‘ für einen humanoiden Roboter zunächst zwei prinzipielle Varianten. Als Va- 
riante (1) könnte eine Möglichkeit für das Design von referenziellen Praktiken in 
einer verbesserten Explizitheit des initialen Orientierungsangebots liegen. Die- 
ses hätte einerseits den Vorteil, dass der Roboter anschließend weniger mit mög- 
lichen auftretenden Schwierigkeiten umgehen müsste. Andererseits würde ein 
solches Verfahren wenig Übertragbarkeit und Flexibilität bieten. Demgegenüber 
besteht Variante (2) im Ausbau der interaktiven, auf Monitoring basierenden 
Komponente. Das technische System müsste im Anschluss bzw. während des Aus- 
führens der roboterseitigen deiktischen Referenz die Auswirkungen der eigenen 
Handlungen mit beobachten und darauf dynamisch reagieren. Konkret müsste 
hier ein solches Verfahren bestehen in: (i) dem Angebot einer lokal-deiktischen 
Referenz, (ii) der Beobachtung, ob die Nutzer seinem Angebot folgen oder nicht, 
(iii) bei Bedarf dem Angebot eines erneuten Orientierungshinweises bzw. einer 
Reparatur. Ein so konzipiertes, auf Interaktivität und Monitoring basierendes 
Verfahren erscheint interaktional interessant und wurde in einer Folgestudie (s. 
Abschnitt 7) umgesetzt und erprobt. 
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7 Referenzielle Praktik als sequenzstruktureller 
‚Building Block‘? 


Die anhand der ersten Studie entwickelten Implikationen wurden in die nächste 
Iteration für das Design der referenziellen Praktiken des Roboters übernommen 
und im Rahmen einer Folgestudie (Studie 2) erprobt. Der Fokus liegt hier insbe- 
sondere auf dem Ansatz eines lokalen ‚Building Blocks‘, der auf den Ideen von 
Monitoring und Interaktivität basiert: (i) Angebot einer lokal-deiktischen Refe- 
renz, (ii) Beobachtung, ob die Nutzer seinem Angebot folgen oder nicht, (iii) bei 
Bedarf Angebot eines erneuten Orientierungshinweises bzw. einer Reparatur. 
Hiermit wird ein erster Versuch konzipiert und implementiert, referenzielle Prak- 
tiken für die Mensch-Roboter-Interaktion als sequenzielle Strukturen zu verste- 
hen. Anhand einer Fallanalyse (Studie 2, 4_007) wird der Frage nachgegangen, 
inwiefern sich ein solcher Ansatz als umsetzbar erweist. Hierzu dient die folgende 
Analyse: 

(a) Deiktische Referenz (R): In unserem Beispiel sind drei Besucher - eine 
Frau mit zwei Kindern — vis-a-vis dem Roboter positioniert und auf diesen orien- 
tiert (#00.38.26). Der Roboter lädt — per Sprache und Geste und mit Kopfausrich- 
tung auf die Besucher - ein, das Exponat zu seiner rechten Seite (EX-1) zu be- 
trachten: „dort drüben könnt ihr sehen wer damals auf der sparrenburg gewohnt 
hat“ (Z. 01-02, #00.38.26). B1 und B2 folgen diesem Angebot sofort, B3 hingegen 
bleibt auf den Roboter fokussiert (#00.40.78). 


01 R-ver: |dort |drüben könnt ihr sehen |wer | 
R-ges: |d-onset |d-peak | 
R-hea: |@Besucher ... 

|#00:38:26 

02 R-ver: |damals auf der sparrenburg gewohnt |hat| 


R-ges: |d-retract 
R-hea: ... |#00:40:78 
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(b) Monitoring von Erfolg/Misserfolg (R): Entsprechend des implementierten 
Prinzips, dass der Roboter den Erfolg/Misserfolg seiner Handlungen beobachtet 
stellt sich die obige Situation aus Sicht des Roboters wie folgt dar: Das technische 
System kann zumindest eine Person - die hier besonders interessante B3 (die der 
deiktischen Referenz nicht folgt) - durchgängig stabil detektieren (dieses wird in 
der Videoaufzeichnung dadurch angezeigt, dass eine ‚bounding box‘ um den Kopf 
von B3 inkl. Kategorisierung „Nao“ erscheint (am unteren Bildrand unter der 
‚bounding box‘, leicht abgeschnitten)) und damit beobachten, dass sie auch nach 
dem deiktischen Verweis auf das Exponat weiterhin auf den Roboter orientiert 
bleibt (#00.38.26; 00:40:78). 


00:38:26 | 
_ Z 
| Robot-Internal-View z 
um Robot-Internal-Vie 
Ti 


3 7 NAN | 


(c) Zweiter deiktischer Verweis als Reparaturangebot: Der implementierten 
Handlungslogik folgend entscheidet sich das technische System für die Relevanz 
eines Reparaturangebots und bietet einen zweiten deiktischen Verweis an: „dort 
drüben auf dem großen bild“ (Z. 03-04, #00:45:22), wobei hier nun auch die Kop- 
forientierung des Roboters auf das Exponat verweist. Auf diesen zweiten Orien- 
tierungshinweis reagiert B3, indem er nun auch den Kopf in Richtung des Expo- 
nats wendet (#00:46:78). 
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03 R-ver: |(0.5) |dort drüben auf dem |großen 
R-ges: |d-on |d-peak 
R-hea: |>>>>>>>>>>>>>>>>>>>>> | EX-1 


|#00:45:22 


04 R-ver: bild |(0.7) | 
R-ges: |d-retract 


R-hea: | <<<<<<<<< | 


|#00:46:78 


Insgesamt lässt sich also festhalten, dass sich der gewählte Ansatz als grundsätz- 
lich funktional erweist. Damit ist ein erster Schritt in Richtung des Erprobens von 
kleinen ‚Building Blocks‘ für sequenzielle Handlungsstrukturen erfolgt, deren 
verschiedene Facetten und Details künftig weiter zu untersuchen sind. Erste Hin- 
weise finden sich auch auf Herausforderungen in Bezug auf Mehrpersonen-Kons- 
tellationen, Unsicherheit und Entscheidungen bei weniger eindeutigen Situatio- 
nen (s. z.B. beginnend in Pitsch et al 2016, Pitsch 2016). 


8 Zusammenfassung und Diskussion 


Im Verlauf des Texts haben wir Mensch-Roboter-Interaktion als ein Forschungs- 
instrument für die Interaktionale Linguistik eingeführt und dieses anhand der 
Frage ausbuchstabiert, wie referenzielle Praktiken für einen Roboter designt wer- 
den können, der in engem Kontakt mit Menschen agiert und für diese intuitiv in- 
terpretierbar sein soll. Diese Frage speist sich zum einen aus einer multimodal 
orientierten Interaktionslinguistik, für die eine Aufgabe darin besteht, das kom- 
plexe multimodale Zusammenspiel verschiedener kommunikativer Ressourcen 
zu „multimodal packages“ unter den Bedingungen von Situiertheit, Interaktivität 
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und Kontingenz systematisch zu beschrieben. Zum anderen trifft die Forschungs- 
frage auf aktuelle Herausforderungen in den Social Robotics, die darauf zielen, 
Robotersysteme so mit Interaktionsfähigkeiten auszustatten, dass sie von men- 
schlichen Nutzern in Alltagskontexten mit den Mittel natürlichsprachlicher In- 
teraktion intuitiv bedienbar sind. 

Dieser Frage sind wir empirisch anhand von zwei aufeinander aufbauenden 
Studien nachgegangen, in denen ein humanoider Roboter in der Rolle eines Mu- 
seumsführers agiert und vorbeikommenden Besuchern verschiedene Exponate 
erklärt. Dabei konnten die folgenden Ergebnisse herausgearbeitet werden: 

(a) Dissoziation der Ressourcen Blick und Geste: Es finden sich erste Hin- 
weise darauf, dass sich Interaktionsbeteiligte an einzelnen Aspekten bzw. Moda- 
litäten einer ‚kommunikativen Gestalt‘ orientieren. Dieses ist korpusbasiert wei- 
ter zu analysieren. 

(b) Praktik der Re-Orientierung im Fall von Unsicherheiten: Im Fall der 
Ambivalenz und Unsicherheit, auf welches Exponat vom Roboter verwiesen wird, 
findet sich eine Nutzer-Praktik ‚Re-Orientierung zum Roboter‘, von dem weitere 
Disambiguierungshinweise prinzipiell erwartet werden könnten. 

(c) Dauer der Zeigegeste als interaktive Herstellungsleistung: Da nicht in 
allen Details vorhersehbar ist, wann genau Nutzer die visuellen Orientierungs- 
hinweise des Roboters wahrnehmen können, ist die erforderliche Haltedauer ei- 
ner Zeigegeste schwer im Vorfeld definierbar. Vielmehr ist ein interaktiver Ansatz 
erforderlich. 

(d) Implikationen für das Design referenzieller Praktiken - Monitoring 
und Interaktivität: Als Implikation für das Design eines ‚Building Blocks‘ ‚refe- 
renzielle Praktiken‘ für einen humanoiden Roboter wurde ein aufMonitoring und 
Interaktivität basierendes Verfahren beschrieben, das in einer Folgestudie imple- 
mentiert und erprobt wurde: Das technische System soll im Anschluss bzw. wäh- 
rend des Ausführens der roboterseitigen deiktischen Referenz die Auswirkungen 
der eigenen Handlungen mit beobachten und darauf dynamisch reagieren. Kon- 
kret wurde das Folgende implementiert: (i) Angebot einer lokal-deiktischen Re- 
ferenz, (ii) Beobachtung, ob die Nutzer seinem Angebot folgen oder nicht, (iii) bei 
Bedarf Angebot eines erneuten Orientierungshinweises bzw. einer Reparatur. 
Eine erste Auswertung der Studiendaten zeigt, dass sich dieser Ansatz grundsätz- 
lich als funktional erweist und so ein erstes Angebot für das Erproben sequenzi- 
eller Handlungsstrukturen vorliegt. Verschiedene Facetten und Details sind künf- 
tig weiter zu untersuchen, wie z.B. die Herausforderungen einer Mehrpersonen- 
Konstellation, Unsicherheit und Entscheidungen bei weniger eindeutigen Situa- 
tionen (s. z.B. Pitsch 2016). 
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Zusammenfassend sollten diese empirischen Beobachtungen am Beispiel der 
Lokal-Deixis als ein Proof of Concept den Mehrwert von semi-experimentellen 
Studiendesigns und der Mensch-Roboter-Interaktion als einem Instrument zur 
Erforschung der Situiertheit von multimodaler Kommunikation erkennbar wer- 
den lassen: Die Modellierung - und damit höchst systematisch-präzise Beschrei- 
bung - von interaktionalen ‚Building Blocks‘ und die Überprüfung der „Risiken 
und Nebenwirkungen“ von Interaktionsverfahren in konkreten Interaktionsstu- 
dien bringen zum einen die Grenzen vorliegender Beschreibungen und Ergeb- 
nisse ans Licht. Zum anderen ermöglichen solche Studien im Sinne Garfinkel- 
scher Krisen-Experimente durch das (un/beabsichtige) Aufbrechen gewohnter 
Alltagsstrukturen einen vertieften Einblick in die Funktionsweise interaktiver 
Verfahren und Zusammenhänge. 
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Ohne Sprache keine Teilnehmenden- 
interpretation? 


Methodologische Herausforderungen bei der Analyse 
sprachfreier Aktivitäten 


Abstract: Für Konversationsanalysen multimodaler Prägung ist das Vorhanden- 
sein von Sprache von immenser Wichtigkeit, da die Teilnehmenden mit ihren ver- 
balen Beiträgen die Interpretation der laufenden Interaktion anzeigen. Diese Teil- 
nehmendeninterpretationen stellen den primären Analysezugang für konversati- 
onsanalytisch orientierte Interaktionsforschende dar. Fehlt die Sprache, ist der 
Analysezugang häufig erschwert. Da sprachfreie Aktivitäten selbstverständlicher 
Teil des Alltags sind, ist dies vor allem ein methodologisches Problem: Wie kön- 
nen Forschende einen Zugang zu den (nicht-sprachlichen) Teilnehmendeninter- 
pretationen von multimodalen Aktivitäten ohne Sprache bekommen? Ziel des 
Beitrags ist es zu zeigen, inwiefern im Rahmen der konversationsanalytischen 
Methodologie Analysen multimodaler Aktivitäten ohne sprachliche Beteiligung 
möglich sind. Dazu wird anhand von audiovisuellen Daten einer Theaterprobe 
rekonstruiert, wie Teilnehmende innerhalb einer sozialen Situation sprachfreien 
Aktivitäten einen Sinn zuschreiben, auf den bezogen sie agieren können. Unter 
Einbezug einer emischen Perspektive können Forschende sich das ethnometho- 
dologische Problem der Teilnehmenden zu Nutze machen und mithilfe der Prak- 
tiken des Monitorings und des Displayings Teilnehmendeninterpretationen ablei- 
ten. Wie dies in der Forschungspraxis angewendet werden kann, soll anhand der 
multimodalen Aktivität Arbeitsanweisung während einer Theaterprobe gezeigt 
werden, bei der die Beteiligten entweder auf nur wenig oder gar kein sprachliches 
Material zurückgreifen. 
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1 Das next turn proof procedure als zentrales 
Prinzip der Konversationsanalyse 


Die von Schmitt (2005) beschriebene „visuelle Revolution“ in der Interaktions- 
forschung ist seit über zehn Jahren in vollem Gange. Die neue multimodale Per- 
spektive ermöglicht den Blick aufbis dato nicht oder nur unzureichend beschrie- 
bene Interaktionsressourcen und erweitert Interaktionsanalysen um Aspekte der 
Mobilität (Haddington et al. 2013), Objektmanipulationen (Nevile et al. 2014) oder 
Berührungen (Cekaite 2015). Obwohl mittlerweile nicht-sprachliche Ressourcen 
zum etablierten Phänomenbereich von multimodalen Interaktionsforschenden 
gehören, folgen häufig viele Analysen nach wie vor einem sprachzentrierten An- 
satz. Dies ist einerseits gerechtfertigt, wenn linguistisch orientierte Konversati- 
onsanalytiker/innen primär sprachliche Prozesse der lokalen und reflexiven Her- 
stellung sozialer Ordnung in Settings untersuchen, in denen Sprache eine wich- 
tige Ressource der Interagierenden darstellt. Anderseits kann der sprachliche Fo- 
kus den Blick auf jene nicht-sprachlichen Praktiken erschweren, die im Vollzug 
von Interaktionen selbstverständlicher Teil der kommunikativen, holistisch-mul- 
timodalen Gestalten sind. Denn nach wie vor gilt das, was Bergmann (1981) über 
konversationsanalytisch arbeitende Linguisten/innen schreibt, auch für ethno- 
methodologisch-konversationsanalytisch orientierte Forschende, die an multi- 
modalen Praktiken interessiert sind: 


So wird es etwa für einen Linguisten mit konversationsanalytischen Interessen zweifellos 
schwierig werden, immer im Kopf zu behalten, daß sich seine Analyse nicht in erster Linie 
mit Sprache[,] sondern mit Interaktion zu beschäftigen hat. Er muß sich in seiner Arbeit 
immer daran orientieren, daß die einzelne sprachliche Äußerung nur der ‚Gast‘ (Sacks) in 
einem Redezug ist. (Bergmann 1981: 33) 


So wie Sprache nur einen Teil einer Interaktion darstellt, sind in Sequenzen ge- 
ordnete Turns und andere sprachliche Praktiken lediglich Aspekte der verbalen 
Modalität. Um die multimodal organisierte Vollzugswirklichkeit beschreiben zu 
können, wird die Konversationsanalyse daher um räumlich-visuelle Modalitäten 
erweitert (Keevallik 2018, Mondada 2019a). Dass diese Erweiterung möglich und 
in der simplest systematics von Sacks, Schegloff und Jefferson (1974) bereits an- 
gelegt ist, zeigt die dortige Diskussion um den transition relevance place: Sacks, 
Schegloff und Jefferson (1974: 705 f.) entscheiden sich aufgrund der Granularität 
ihrer Argumentation in Bezug auf das Turn-Taking für transition relevance place 
und unter anderem gegen transition relevance space. Letzteres könnte laut Sacks, 
Schegloff und Jefferson Momente der Stille zwischen Turns fassen, die von den 
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Teilnehmenden nicht als Pausen behandelt werden - was einen starken Hinweis 
darauf liefert, dass es sich dort nur um Momente der Stille der verbalen Modalität 
handelt, während andere Modalitäten in diesen Momenten den Teilnehmenden 
anzeigen, dass hier kein Sprecherwechsel erfolgen kann/soll. 

Nichtsdestotrotz ist die Konversationsanalyse ein Ansatz, dessen zentrales 
Prinzip, das next turn proof procedure (Sacks et al. 1974), anhand von sprachli- 
chen Telefongesprächsdaten (Schegloff & Sacks 1973) entwickelt wurde. Das 
Prinzip setzt am ethnomethodologischen Problem von Interaktionsteilnehmen- 
den an, dass sie nicht „in die Köpfe“ ihrer Ko-Interagierenden schauen können. 
Sie sind vielmehr darauf angewiesen, dass die anderen Beteiligten ihre Interpre- 
tationen der laufenden Interaktion als multimodale Gestalt (Mondada 2014) im 
Rahmen des next turn proof procedure anzeigen: „it obliges its participants to dis- 
play to each other, in a turn’s talk, their understanding of other turns’ talk“ 
(Sacks et al. 1974: 728). 

Der analytische Zugriff auf soziale Interaktion erfolgt also im Rahmen der 
Konversationsanalyse über die Teilnehmendeninterpretationen. Das bedeutet, 
dass in aufeinander bezogenen Redezügen (Turns) der Folgeturn jeweils einen 
Hinweis darauf liefert, als welche Handlung der/die Sprechende den vorherigen 
Turn verstanden hat. Folgt zum Beispiel auf einen ersten Turn eine Antwort oder 
eine Entschuldigung, kann davon ausgegangen werden, dass der/diejenige Spre- 
chende den vorherigen Redezug als Frage oder Beschwerde verstanden hat. Im 
daran anschließenden Turn hat der/die initiale Sprechende die Möglichkeit im 
Turndesign seine/ihre Interpretation dieses Turns anzuzeigen usw. (vgl. für die 
Grenzen dieses Verfahrens z.B. Küttner 2014). Dieser emische Ansatz bildet den 
Kern der konversationsanalytischen Methodologie und grenzt die Konversations- 
analyse von beispielsweise inhaltsanalytischen Ansätzen (Schreier 2014) ab, bei 
denen individuelle Handlungen von den Forschenden interpretiert bzw. bewertet 
werden. 

Im Vergleich dazu steht das Display-Konzept im Zentrum der konversations- 
analytischen Methodologie, nach dem die interaktive Ordnung dergestalt vollzo- 
gen wird, dass „Sinn und Ordnung als solche erkennbar hergestellt werden und 
dass auch ihr Erkennen signalisiert wird“ (Deppermann 2000: 99). Damit nimmt 
die Konversationsanalyse in empirischen qualitativen Studien konsequent die e- 
mische Perspektive der Teilnehmenden ein, die ihre Interaktionsbeiträge aufei- 
nander bezogen als accountable (Garfinkel 1967) realisieren. Als zentrale Analy- 
semethode der Konversationsanalyse leistet die schrittweise Sequenzanalyse die 
Bedeutungsrekonstruktion in Interaktionen. Damit werden Interaktionen als Re- 
sultate geordneter und ordnender Praktiken der Teilnehmenden erkennbar. Ge- 
mäß der Maxime „order at all points” (Sacks 1984: 21) ist kein sprachliches Zei- 
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chen in Interaktionen per se überflüssig und kann für die Interaktionsorganisa- 
tion relevant sein. Somit nimmt die Konversationsanalyse Abstand von Interak- 
tionsmodellen, die Gespräche als Prozesse der Kodierung und Dekodierung an- 
nehmen (vgl. Poyatos 2002: 32-34). 

Vielmehr sind alle Beteiligten gleichermaßen daran beteiligt, situativ gebun- 
dene und kontextabhängige Bedeutungsvorschläge für die anderen Interagieren- 
den zu produzieren (vgl. Dausendschön-Gay & Krafft 2002: 32 f.). Diese Ordnung 
sozialer Interaktion steht also nicht vorher fest, sondern ist das Ergebnis der lo- 
kalen Aushandlung der Teilnehmenden einer spezifischen Situation im Vollzug 
als Vollzugswirklichkeit. Aufgabe der Konversationsanalytiker/innen ist es, die- 
se Organisation der Ordnung rekonstruktiv herauszuarbeiten. 

Diese Rekonstruktion der Abfolge von sprachlichen Interaktionsbeiträgen 
als wechselseitige Reaktionen auf vorausgegangene Teilnehmendeninterpretati- 
onen wird mithilfe des next turn proof procedure im Rahmen der Konversations- 
analyse möglich. Allerdings stellt insbesondere die multimodale Verfasstheit von 
Interaktionen Analysierende vor mehrfache Herausforderungen. Zum einen las- 
sen sich die anhand von verbalen Interaktionen entwickelten Konzepte nicht oh- 
ne Weiteres auf multimodale Interaktionen übertragen (vgl. Schmitt 2005) und 
zum anderen ist oft für Forschende nicht eindeutig zu bestimmen, welche multi- 
modalen Informationen die Beteiligten relevant setzen (vgl. Deppermann 2013). 
Diese Herausforderungen wiegen umso schwerer, wenn die Interaktionen von 
den Teilnehmenden gänzlich sprachfrei organisiert werden. Wie können For- 
schende sprachfreie Interaktionen sequenzanalytisch rekonstruieren, wenn die 
Konzeptualisierung von „multimodalen Turns“ methodologisch schwierig ist 
(Deppermann & Streeck 2018: 19)? Kann in solchen Situationen überhaupt von 
einem next turn proof procedure Gebrauch gemacht werden? Ist es unter Umstän- 
den zweckmäßiger von einem next action proof procedure zu sprechen? Oder 
kann es ohne Sprache keine Teilnehmendeninterpretationen geben, weshalb 
sprachfreie Interaktionen konversationsanalytisch nicht bearbeitbar wären? 

Der Beitrag versucht Antworten auf diese Fragen zu geben und beschreibt 
einen Ansatz, der sich am Prinzip des next turn proof procedures orientiert und 
ein sequenzanalytisches Vorgehen dadurch ermöglicht, dass die Koordinations- 
prozesse (vgl. Deppermann & Schmitt 2007) der Beteiligten im interaktiven Voll- 
zug als Ausgangspunkt für die Analysen genommen werden. Anhand von zwei 
sprachfreien Arbeitsanweisungen während einer Theaterprobe werden das Dis- 
playing und das Monitoring der Beteiligten für den analytischen Zugriff auf die 
Organisation der Anweisungen verwendet. Unter Rückgriff auf im Rahmen der 
Interaktionsforschung bereits etablierte multimodale Verfahren der Teilnehmen- 
deninterpretation wird im Folgenden zum einen gezeigt, wie Analysen sprach- 
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freier Aktivitäten mithilfe der Wechselseitigkeit der Verfahren Monitoring und 
Displaying durchgeführt werden können. Zum anderen werden die Grenzen die- 
ses analytischen Zugriffs gezeigt: Wenn für Forschende kein wechselseitiges Mo- 
nitoring erkennbar ist, kann keine Interaktion rekonstruiert werden. Damit bietet 
der Beitrag einen für die Linguistik zunächst bizarren Blick auf den Gegenstand 
Sprache als Leerstelle in sprachfreien Interaktionen. Mit dieser Perspektive wer- 
den jedoch sowohl die konstitutiven Eigenschaften von Sprache als auch die mit 
einer Beteiligungsweise der verbalen Abstinenz verbundenen kommunikativen 
Implikationen für die Teilnehmenden erkennbar. 


2 Multimodale Verfahren der Teilnehmenden- 
interpretation 


Die sogenannte Teilnehmendeninterpretation beruht im ethnomethodologischen 
Sinne darauf, dass alle von Menschen multimodal produzierten Interaktionsbei- 
träge auf die situativen und kontextuellen Umstände verweisen, in denen sich 
die Interagierenden bewegen. Durch den Verweis auf die aktuelle Situation er- 
zeugen die multimodalen Handlungen der Interagierenden letztendlich den Kon- 
text, auf den sie sich beziehen. Dadurch zeigen Teilnehmende einer Situation ei- 
nander ihr Verständnis einer Handlung innerhalb des Kontextes an, was es an- 
deren Interagierenden ermöglicht, auf dieses angezeigte Verständnis zu reagie- 
ren und ihrerseits die Interpretation der Situation anzuzeigen und so mitzukon- 
stituieren. Damit wird das, was Teilnehmende einander öffentlich multimodal 
anzeigen, immer zur reflexiven Reaktion auf vorherige indexikalische Verweise 
in der situativen Interaktionshistorie. Versteht man Interaktionen als eine aufei- 
nander bezogene Folge multimodal organisierter Interaktionsbeiträge, wird das 
gegenseitige Anzeigen der Teilnehmendeninterpretation der direkt vorausgegan- 
genen Interaktionsbeiträge der anderen Teilnehmenden zur wichtigsten Infor- 
mationsquelle für Interagierende sowie Interaktionsforschende (Mondada 2006). 

Grundlage der Teilnehmendeninterpretation und damit jeder Interaktion ist, 
dass sich Interagierende gegenseitig ein Display ihres aktuellen Handelns zur 
Verfügung stellen. Dieses Display kann mithilfe verschiedener Modalitäten her- 
gestellt werden, wie Schegloff (2000: 5) für Überlappungssituationen anführt: 
„[participants] can display overtly, in their talk or other conduct, an orientation 
to talk that is simultaneous with their own“. Damit umfasst das Display-Konzept 
sowohl sprachliches Anzeigen einer Teilnehmendeninterpretation (etwa als Ver- 
stehensinferenz im Rahmen einer Antwort, vgl. Deppermann/Helmer 2013) als 
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auch multimodal organisierte embodied displays (Heath 1986; Mondada 2013). 
Deppermann (vgl. 2000: 99-103) erinnert in seinem Plädoyer für die Integration 
von Ethnographie in die Konversationsanalyse daran, dass interaktionale Dis- 
plays von Forschenden nur mit Kontextwissen erkannt werden können. Ein Dis- 
play wird somit lediglich dann als solches erkennbar, wenn die durch die Teil- 
nehmenden hergestellten kontextuellen Relevanzen mitbedacht werden. So wie 
ein Interaktionsbeitrag demnach nicht von seiner situativen Einbettung getrennt 
werden kann, sollte vermieden werden, die multimodalen Gestalten (Mondada 
2014) in ihre Einzel-Modalitäten zerlegen zu wollen, um den so isolierten Moda- 
litäten kommunikative Funktionen bzw. eigene Displays zuzuschreiben. Dies ist 
methodisch insofern problematisch, als dass körperliche Displays oftmals impli- 
zit und ambig (Deppermann 2013: 4) und nur als Ressourcenbündel für Interagie- 
rende und Forschende verstehbar sind. Deutlich wird dieser Punkt anhand der 
zwei Fallbeispiele dieses Beitrags, in denen nicht einzelne Modalitäten, sondern 
das Zusammenspiel aller verfügbaren multimodalen Ressourcen den Zugriff auf 
Displays in Interaktionen ermöglicht. 

Obwohl Stivers & Rossano (2010: 53 f.) herausstellen, dass bislang nach wie 
vor ungeklärt ist, wie Menschen Handlungen als bestimmte Handlungen erken- 
nen, bestehen interaktionale Displays aus genau jenen Praktiken, mit denen Teil- 
nehmende einander ihre Interaktionen organisieren und somit aufeinander be- 
zogen ihre Partizipation an der laufenden Interaktion anzeigen. Dies kann so- 
wohl sprachliche als auch andere körperliche Praktiken umfassen. Die dazu ver- 
wendeten multimodalen Ressourcen der Verbalität, Gestik, Blick, Mimik, usw. 
kommen in menschlicher Interaktion weder einzeln vor, noch werden sie von In- 
teragierenden separat wahrgenommen. Face-to-Face-Interaktionen sind folglich 
immer multimodal. Obwohl die sequenzielle Ordnung der Interaktionsbeiträge 
außer Frage steht, bedeutet das, dass Teilnehmende einander konstant und un- 
abhängig von ihrem Sprecherstatus multimodale Displays anbieten, auf die an- 
dere im Rahmen ihrer Teilnehmendeninterpretation reagieren (können). Ein an 
eine Person adressierter Interaktionsbeitrag beinhaltet daher ebenso ein körper- 
liches Anzeigen des/r Adressierten, inwiefern er/sie sich als Adressat/in versteht, 
wie auch die Reaktion des Interagierenden auf dieses Display. Schaut der/die 
Adressierte zurück? Zieht er/sie die Augenbrauen zusammen? Nickt er/sie? All 
diese körperlichen Reaktionen des/r Adressierten wirken emergent auf die Pro- 
duktion des Interaktionsbeitrags ein, noch bevor die Äußerung überhaupt abge- 
schlossen ist (vgl. Goodwin 1979, 1980a). Die Körper der Interagierenden werden 
von den Teilnehmenden somit als „semiotische Anzeigetafeln“ (Deppermann et 
al. 2016: 4) wahrgenommen und benutzt. Diese visuelle Orientierung der Teilneh- 
menden hilft ihnen zum einen dabei, ambige Strukturen zu verstehen, z.B. bei 
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der pronominalen Adressierung, und ermöglicht zum anderen die Gesamtheit ei- 
ner sozialen Situation (Goffman 1981) zu erfassen. 

Je nach Grad der Involvierung in eine Aktivität als „capacity of an individual 
to give, or withhold from giving, his concerted attention to some activityathand“ 
(Goffman 1963: 43 f.) entstehen unterschiedliche Displays, aufgrund derer sich 
Teilnehmende innerhalb einer sozialen Situation gegenseitig anzeigen, welchen 
Teilnehmendenstatus sie einander zuschreiben. Interagierende mit aktivem en- 
gagement display machen sich so für andere Beteiligte kommunikativ verfügbar, 
während ein disengagement display Nichtverfügbarkeit anzeigt (Goodwin 1981). 
Wie Goodwin zeigt, ist neben der Körperorientierung besonders der gegenseitige 
Blickkontakt ein Verfahren, mit denen Teilnehmende einander engagement dis- 
plays anzeigen können. Bleibt der Blickkontakt aus oder verändert sich die Kör- 
perorientierung zu stark, kann es zu Pausierungen oder Abbrüchen der laufen- 
den Interaktionssituation kommen. 

Voraussetzung für engagement displays also ist eine gegenseitige Wahrneh- 
mung (Wahrnehmungswahrnehmung, Hausendorf 2009: 192) der Teilnehmenden 
innerhalb einer sozialen Situation, in der sich zwei oder mehr Personen inner- 
halb seh- und/oder hörbarer Reichweite voneinander befinden („in one another’s 
immediate presence“, Goffman 1964: 135) und diese Displays wechselseitig audi- 
tiv bzw. visuell verfolgen können („mutual monitoring“, Goodwin 1980b). Ob- 
wohl die Wahrnehmung nicht mit dem Sehen gleichzusetzen ist (Merleau-Ponty 
2016 [1946]) und Monitoring auch rein auditiv organisiert sein kann (z.B. in Situa- 
tionen, in denen kein Blickkontakt möglich ist, z.B. in Telefongesprächen), kommt 
der Ressource Blick im Rahmen des visuellen Monitorings eine besondere Rolle 
zu: 


First, sight begins to take on an added and special role. Each individual can see that he is 
being experienced in some way, and he will guide at least some of his conduct according to 
the perceived identity and initial response of his audience. (Goffman 1963: 16) 


Eine solche über wechselseitiges Monitoring hergestellte „Wirbeziehung“ (Schütz 
1932: 181) zeigt den Teilnehmenden (und damit auch den Forschenden) an, dass 
die monitorenden Interagierenden sich als kopräsente Beteiligte verstehen (Clark 
& Krych 2004; Goffman 2001; Goodwin 1981). Dies umfasst dabei auch solche In- 
teragierende, die zwar verbal inaktiv sind, aber ansonsten ebenfalls Teil des Ge- 
samtgeschehens sind, was Heidtmann & Föh (2007) als „verbale Abstinenz“ kon- 
zeptualisieren. Dabei handelt es sich um eine interaktive Beteiligungsweise, die 
ohne Sprachbeiträge auskommt. Die Beteiligung an der laufenden Interaktion 
wird vor allem über das Blickverhalten und die körperliche Ausrichtung erreicht, 
indem z.B. ein Sprecherwechsel per Kopfdrehung mitvollzogen und unter gewis- 
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sen Umständen auch antizipierend (Holler & Kendrick 2015; Kendrick & Holler 
2017) realisiert werden kann. Denkbar ist in diesem Zuge die ganze Bandbreite 
nicht-sprachlicher Praktiken wie z.B. Nicken, Winken oder Berühren. Verbale Ab- 
stinenz ist damit eine Beteiligungsweise an Interaktionen, die trotz ihrer geringen 
gesprächsorganisatorischen Verfasstheit (es werden keine eigenen sprachlichen 
Beiträge produziert) durchaus große Relevanz für den Interaktionsverlauf haben 
kann. Denn auch wenn verbal abstinente Interagierende sprachlich nicht in Er- 
scheinung treten, tragen sie durchaus zum gemeinsam ausgehandelten Vollzug 
einer Interaktion bei, indem sie sich beispielsweise durch einen gesenkten Kopf 
nicht als nächste Sprecher zur Verfügung stellen. Heidtmann & Föh (vgl. 2007: 
272) beschreiben die verbal abstinente Beteiligungsweise in ihrem Beitrag als ein 
Verhalten, das sprachlich organisierten Aktivitäten primär reagierend folgt. So- 
mit stellt sich für die Forscherinnen die Frage nach eventuell fehlenden Teilneh- 
mendeninterpretationen in ihren Daten gar nicht. Stattdessen können sie die Re- 
aktionen der verbal abstinenten Beteiligten auf die Turns der Sprechenden bezie- 
hen und dadurch die Situation sequenzanalytisch bearbeiten. Im Folgenden soll 
es im Gegensatz dazu um Situationen gehen, in denen alle Beteiligten sich verbal 
abstinent an Instruktionsaktivitäten während einer Theaterprobe beteiligen, sich 
dabei gegenseitig audio-visuell monitoren und füreinander engagement displays 
herstellen. 


3 Datengrundlage: Instruktionen in 
Theaterproben 


Die Datengrundlage dieses Beitrags bildet ein Korpus von 31 Proben eines Thea- 
terstücks. Diese fanden an einem deutschen Stadttheater statt und wurden mit 
vier Kameras sowie zwei mobilen Eye-Tracking-Brillen audiovisuell aufgezeich- 
net. Insgesamt umfasst das Korpus 200 Stunden Multicam-Videomaterial des 
Probenprozesses von der Konzeptionsprobe bis zur Generalprobe. Da der Autor 
als Videokünstler für die Produktion eingesetzt war, konnte er ethnographische 
Informationen zum Probenverlauf im Allgemeinen und dem Herstellungsprozess 
von multimedialen Videoinstallationen im Speziellen sammeln. Besonders Letz- 
teres wird im Rahmen des ersten Fallbeispiels relevant werden. 

Die verbalsprachliche Transkription der präsentierten Fälle folgt GAT2 (Sel- 
ting et al. 2009); die multimodale Annotation orientiert sich an Mondada (2019b). 
Alle Standbilder sind zur Anonymisierung visuell verfremdet, wobei in den Ana- 
lysen relevante Aspekte durch rote Pfeile oder Kreise hervorgehoben werden. Die 
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in diesem Beitrag verwendeten Datenausschnitte stammen aus einer technischen 
Probe im fortgeschrittenen Produktionsverlauf, bei der die Theaterschaffenden 
nicht mehr auf einer Probebühne, sondern bereits auf dem finalen Spielort arbei- 
ten. Wie sich zeigen wird, umfasst die künstlerische Arbeit neben den eigentli- 
chen Spielaktivitäten auch das Koordinieren von Licht- und Toneinsätzen, die 
vom Regisseur als künstlerischem Leiter angewiesen werden. Instruktionen er- 
folgen — nicht nur am Theater, sondern auch in Alltagsinteraktionen - typischer- 
weise im Rahmen von IRE-Sequenzen (vgl. Mehan 1979; Zemel & Koschmann 
2011). Dabei wird zunächst in der initiation das Angewiesene bestimmt, das da- 
rauf in der response der instruierten Person eine Realisierung erfährt. Abschlie- 
ßend wird die Umsetzung im Zuge einer evaluation durch die instruierende Per- 
son bewertet. Solche IRE-Sequenzen liegen auch den im Folgenden betrachteten 
Situationen zugrunde. Sie werden jedoch von den Beteiligten jeweils weitestge- 
hend sprachfrei durch verbal abstinente Beteiligungsweisen vollzogen. 


4 Displaying und Monitoring als analytische 
Zugriffe auf sprachfreie Aktivitäten 


Das Extrahieren der Teilnehmendeninterpretation verbal abstinenter Aktivitäten 
stellt, wie oben beschrieben, eine analytische Herausforderung in Konversations- 
analysen mit konsequent multimodaler Perspektive dar. Wie können Forschende 
auf ein next turn proof procedure zurückgreifen, wenn es keine Sprache (und da- 
mit keine Turns) gibt? Oder wie Deppermann (2013: 4) fragt: „How can we ac- 
count for bodily activities?“ Die Antwort auf diese Fragen soll im Folgenden an- 
hand zweier verbal abstinent organisierter Instruktionsaktivitäten skizziert wer- 
den und kann als Blaupause für den analytischen Zugriff auf verbal abstinente 
Aktivitäten im Rahmen von multimodalen Interaktionsanalysen dienen. Im Kern 
setzt die hier präsentierte Lösung für dieses methodologische Problem am Prin- 
zip des next turn proof procedure an. Anstatt jedoch die (sprachlichen) Reaktio- 
nen bezüglich vorausgegangener Turns zu betrachteten und davon die Teilneh- 
mendeninterpretation abzuleiten, rücken nun die Displays in den Fokus, die In- 
teragierende füreinander öffentlich herstellen. Um allerdings zu verstehen, wel- 
che Handlungen Teilnehmende realisieren, reicht es nicht aus, sich lediglich die 
Reaktionen der Teilnehmenden auf bestimmte Interaktionsbeiträge anzuschau- 
en. Es ist vielmehr notwendig nachzuvollziehen, welche dieser Beiträge sie inter- 
aktiv verfolgen. Damit wird das gegenseitige Monitoring der Interagierenden zur 
Voraussetzung für soziale Interaktion. Monitoring wird hier konsequent so ver- 
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standen, dass es alle multimodalen Verfahren umfasst, auf die Interagierende zu- 
rückgreifen, um Displays anderer Beteiligter wahrzunehmen. Dies umfasst neben 
dem (visuellen) Beobachten auch das (akustische) Zuhören, das (haptische) Spü- 
ren sowie — wie Mondada (2019a) zeigt — potentiell auch Riechen und Schmecken. 

Die zwei im Folgenden präsentierten Fälle unterscheiden sich hinsichtlich 
des Grades ihrer verbal abstinenten Gestaltung. Während der instruierende Re- 
gisseur im ersten Fall (4.1) eine sprachlich gestaltete evaluation realisiert, die das 
Vorherige als Instruktion erkennbar werden lässt, vollziehen der Regisseur und 
die instruierte Regieassistentin im zweiten Fall (4.2) die gesamte IRE-Sequenz 
sprachfrei. Die Analysen zeigen das Potential, das dem analytischen Zugriff auf 
sprachfrei organisierte Aktivitäten über die Wechselseitigkeit der Verfahren Dis- 
playing und Monitoring zugrunde liegt. 


4.1 Fall 1: teilweise verbal abstinente Instruktion 


Der Fall beschreibt eine Situation, in der die Schauspielenden auf der Bühne ihre 
Positionen durchgehen, während der Inspizient (INS) in einer separaten und von 
der Bühne aus nicht einsehbaren Kabine Licht-, Ton- und Videoeinsätze startet, 
auf die die Schauspielenden mit ihrem Spiel reagieren: Sie bewegen sich auf die 
vorher vereinbarten Positionen in Abstimmung mit den jeweiligen Signalen. 
Während sie die Bühne langsam verlassen, wird das Licht verdunkelt und ein Vi- 
deo auf einer hinteren Leinwand abgespielt. Der Licht-, Musik- und Videoeinsatz 
sind aneinandergekoppelt und werden vom Inspizienten in seiner Kabine per 
Knopfdruck gestartet. Um eine Evaluationsphase der Probe zu initiieren, in der 
der Regisseur (REG) den Schauspielenden zu ihrem Spiel Feedback geben und 
Instruktionen bzgl. der kommenden Durchläufe äußern kann (vgl. Krug et al. 
2020), muss der Regisseur den Inspizienten anweisen, die laufenden Licht-, Ton- 
und Videoeinsätze zu stoppen. Der Transkriptausschnitt endet mit einer Evalua- 
tion des Regisseurs (DANke, Z. 007) der unmittelbar vorherigen Handlung des In- 
spizienten, der die Musik stoppt (Z. 006). Musikstoppen und Bedanken werden 
dadurch als zwei aufeinander bezogene Handlungen erkennbar. Nicht deutlich 
wird in dem Transkriptausschnitt hingegen die kommunikative Arbeit, die der 
Regisseur ab dem Aktivitätsübergangsmarker (vgl. Keevallik 2010) „oKAY“ (Z. 002) 
leistet, um den Inspizienten zu dieser Handlung zu bewegen. Dass es sich hier 
um eine als IRE-Sequenz organisierte Instruktion und nicht, wie möglicherweise 
anhand des Transkripts annehmbar, um eine Paarsequenz (Angebot-Annahme) 
handelt, wird erst deutlich, betrachtet man die koordinativen Prozesse des Moni- 
torings und Displayings der Beteiligten in der Phase verbaler Abstinenz (Z. 003- 
006). 
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001 (1.0) (4.0) 


002 REG OKAY, 


003 (2.0) 
004 INS (unv., verzerrt über Mikrophon) 
005 (21.5) 
006 (0.5) 


007 REG DANke; 


Um die Instruktion vollziehen zu können, bearbeiten Regisseur und Inspizient 
das praktische Problem der Herstellung gegenseitiger Wahrnehmung mithilfe 
verschiedener Praktiken (Winken, Stampfen, Positionieren, Klatschen, Äußerun- 
gen, Ausführung des Arbeitsauftrags zum nächstmöglichen Zeitpunkt) und er- 
möglichen damit einen Einblick in ihre Monitoring- und Displayverfahren (Sch- 
mitt & Deppermann 2007). 

a) Erster Instruktionsversuch: Einarmiges Winken — Mit Einsatz der Musik (Z. 
001) springt der Regisseur auf und eilt auf die Bühne. Er verbalisiert zunächst ein 
zur Bühne orientiertes „oKAY,“ (Z. 002) mit dem im beobachteten Theatersetting 
typischerweise das szenische Spiel durch den Regisseur beendet und die Evalua- 
tionsphase mit den Regieanweisungen eingeleitet wird. Danach dreht er sich zum 
Inspizienten um und winkt mit seiner rechten Hand in Richtung der Inspizien- 
tenkabine (Abb. 1). Von seiner Position auf der Bühne kann der Regisseur nur die 
Stirn des Inspizienten sehen, letzterer den Regisseur aber über eine auf die Bühne 
gerichtete Kamera, von der die Beteiligten wissen. Das Winken des Regisseurs ist 
hier vermutlich zum einen eine Praktik, mit welcher der Regisseur dem Inspizi- 
enten seinen Instruktionswunsch anzeigt. Zum anderen hat das Winken die Funk- 
tion, gegenseitiges Monitoring zu etablieren, das die Voraussetzung für die In- 
struktion darstellt. Wie sich im Folgenden zeigen wird, ist es für den Regisseur 
tendenziell problematisch, dass dieses Monitoring nur einseitig vollzogen werden 
kann - das heißt, er kann dem Inspizienten sein Monitoring anzeigen, dieser hin- 
gegen ist in dieser Hinsicht eingeschränkt. 
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Inspizient 
(in Kabine) 


Inspizient 
in Kabine) N 
\, Regisseur 


Regisseur 


Abb.1: REG winkt mit einem Arm. Abb.2: REG streckt beide Arme. 


Schauspieler 
Schauspieler 


> 


Abb.3: REG nimmt Arm herunter. 


Abb.4: REG dreht sich um. 
(Video startet auf Bildschirm) 


b) Zweiter Instruktionsversuch: Beidarmiges Winken - Als die Musik weiterspielt, 
wertet der Regisseur dies als nicht erfolgte Umsetzung seiner Instruktion. Dass er 
dies der nicht erfolgreich hergestellten wechselseitigen Wahrnehmung zuschreibt, 
zeigt sich in seinem Instruktionsdisplay, das er daraufhin verändert. Dazu geht 
er einen Schritt zurück, streckt sich und reckt gleichzeitig beide Arme in die Höhe 
(Abb. 2). Damit verbessert er nicht nur den Winkel, in dem er den Inspizienten 
sehen kann, sondern vergrößert auch seine Körperfläche und erhöht damit die 
Wahrscheinlichkeit, dass der Inspizient ihn - und damit auch die Instruktion — 
wahrnehmen kann. Die Herstellung von wechselseitiger Wahrnehmung stellt ei- 
ne komplexe Leistung der Interagierenden dar (vgl. Schmitt 2005). Sowohl Inspi- 
zient als auch Regisseur befinden sich im Radius gegenseitiger Wahrnehmung. Die 
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Praktiken des Regisseurs (Winken, Strecken, Position verändern), mit denen er 
seine Arbeitsanweisung auf den für ihn kaum wahrnehmbaren Inspizienten aus- 
richtet, zeigen an, dass er sich in einer sozialen Situation (vgl. Goffman 1964) mit 
ihm begreift. 

c) Account für die verzögerte Umsetzung - Für den Inspizienten ist die wech- 
selseitige Herstellung von Wahrnehmung als „Wahrnehmungswahrnehmung“ 
(Hausendorf 2009: 192) deutlich schwieriger: Weder kann er seine Position in Be- 
zug auf den Regisseur verändern, noch kann er durch Nicken oder ähnliches an- 
zeigen, dass er den Regisseur und dessen Instruktion wahrgenommen und als für 
sich relevant verstanden hat. Dass der Inspizient nicht zurückwinkt, zeigt an, 
dass er das Verhalten des Regisseurs nicht als Teil eines Grußes, sondern vermut- 
lich als Arbeitsanweisung verstanden hat. Ob der Inspizient den Regisseur wahr- 
genommen und die Anweisung als solche verstanden hat, ist an dieser Stelle we- 
der für den Regisseur noch für Interaktionsforschende erkennbar. Lediglich das 
ethnographische Wissen über die technischen Besonderheiten gibt einen Hin- 
weis darauf, weshalb der Inspizient (scheinbar) nicht reagiert: Licht-, Video- und 
Musikeinsatz sind schon für spätere Aufführungen aneinandergekoppelt, wes- 
halb der Inspizient zunächst das Video starten muss, bevor er die Musik ausschal- 
ten kann. Da zu diesem Zeitpunkt seit fünf Proben mit multimedialen Elementen 
geprobt wird, sollte dieses Wissen theoretisch auch dem Regisseur zur Verfügung 
stehen. Dass er es in dieser Situation nicht relevant setzt, verweist eher auf die 
unmittelbare Anforderung, die er an den Inspizienten adressiert: Die Musik soll 
jetzt ungeachtet der technischen Bedingungen stoppen, damit auf der Bühne wei- 
tergearbeitet werden kann. Das stellt den Inspizienten vor eine Herausforderung: 
Wie kann er sein Verhalten dem Regisseur gegenüber trotzdem accountable ma- 
chen? Der Inspizient nutzt dafür das Mikrophon seiner Kabine. Aufgrund der Mu- 
siklautstärke und der Verzerrung des Mikrophons bleibt die Äußerung aber un- 
verständlich (Z. 004). Nichtsdestotrotz behandelt der Regisseur die Äußerung als 
Account für hergestellte Wahrnehmungswahrnehmung, indem er darauf einen 
Arm wieder herunternimmt (Abb. 3) und sich, während der Gesang des Liedes ge- 
rade ausklingt, zu seinen Schauspielenden umdreht (Abb. 4). Zeitgleich mit dem 
Erklingen der nächsten Strophe des Liedes startet das Video auf der Leinwand. 
Dies stellt für den Inspizienten den nächsten notwendigen Schritt dar, um die 
Instruktion des Regisseurs umzusetzen. Dieser hingegen bewertet den Videoein- 
satz als Display dafür, dass seine Instruktion nicht umgesetzt worden ist und un- 
ternimmt abermals einen Versuch, seine Instruktion für den Inspizienten wahr- 
nehmbar zu machen. 
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a 


Inspizient 
in Kabine) 


Abb.7: REG orientiert sich auf INS. 


d) Dritter Instruktionsversuch: Stampfen und Klatschen - Der Regisseur dreht sich 
erneut zum Inspizienten um und versucht diesmal mit zwei anderen Strategien 
die Aufmerksamkeit des Inspizienten zu erhalten und gegenseitige Wahrneh- 
mung herzustellen. Zunächst stampft er bei erhobenem Arm mit dem Fuß auf die 
Bühne (Abb. 5) und klatscht dann, weil weiterhin Video und Musik laufen, mit 
beiden Händen über dem Kopf (Abb. 6). Diese beiden Praktiken stellen insofern 
eine Erweiterung seiner ersten beiden Praktiken (Winken und Positionsverände- 
rung) dar, als dass er hier sein visuelles Display um eine auditive Komponente 
erweitert. Mithilfe dieses audio-visuellen Displays erhöht er die Chance, dass der 
Inspizient ihn monitoren und damit die Instruktion wahrnehmen kann. Damit 
zeigt der Regisseur an, dass für ihn die noch nicht erfolgte Umsetzung der In- 
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struktion am fehlenden Monitoring seitens des Inspizienten liegt und nicht etwa 
am Design seiner Instruktion. Denkbar wären beispielsweise Gesten mit über- 
kreuzten Armen oder horizontal vor dem Hals geführte Handbewegungen als me- 
taphorische Gesten (vgl. McNeill 2005) zum Stoppen des laufenden Vorgangs. Im 
Gegensatz dazu hat der Inspizient Probleme, dem Regisseur anzuzeigen, dass 
eine technische Bedingung und kein interaktionales Problem für die verspätete 
Umsetzung der Instruktion verantwortlich ist. 

e) Erfolgreiche Umsetzung der Instruktion - Als schließlich Video und Musik 
abrupt anhalten (Z. 006), verbalisiert der Regisseur ein an den Inspizienten ori- 
entiertes „DANke“ (Z. 007, Abb. 7). Diese Evaluation zeigt einerseits an, dass der 
Inspizient die Arbeitsanweisung richtig interpretiert hat und markiert anderer- 
seits das Ende dieser Aktivität. 

Die Interagierenden stellen sich in dem Transkriptausschnitt dem praktischen 
Problem der gegenseitigen Wahrnehmung: Weder können sie wissen, was der 
andere wahrnimmt, noch können sie mit Gewissheit sagen, ob und welche mul- 
timodalen Ressourcen von den Ko-Interagierenden relevant gesetzt werden. Eben- 
so wie Forschende sind sie darauf angewiesen, dass alle Teilnehmenden durch 
ihr Handeln (und damit durch ihr Display) ihre lokalen Relevanzen anzeigen bzw. 
accountable machen. Als Teil einer sozialen Situation organisiert der Regisseur 
seine körperlichen Ressourcen als engagement display dergestalt, dass der Inspi- 
zient diese lesen und interpretieren kann. Dieser leistet - abgesehen von seinem 
(erfolglosen) Versuch dem Regisseur sein engagement display anzuzeigen - keine 
erkennbare kommunikative Arbeit, um dem Regisseur zu signalisieren, dass er 
ihn sowohl wahrgenommen hat als auch die Instruktion bereits bearbeitet. Dass 
dieses fehlende engagement display für den Regisseur von Bedeutung ist, zeigt 
sich vor allem in der Erweiterung seines Displays von einer visuellen zu einer au- 
dio-visuellen Gestalt, mit der er gegenseitiges Monitoring evozieren und die In- 
struktion initiieren kann. Beide Interagierenden sind in der Sequenz mit unter- 
schiedlichen verbal abstinenten Beteiligungsmöglichkeiten ausgestattet. Der Ins- 
pizient kann den Regisseur wahrnehmen, ihm dies aber nicht anzeigen, während 
der Regisseur dem Inspizierenden ein Display zur Verfügung stellen kann, das 
des Inspizienten aber nicht monitoren kann. Gegenseitiges Monitoring kann der 
Regisseur erst in dem Moment annehmen, in dem der Inspizient die Instruktion 
ausgeführt hat. Damit verdeutlicht der Fall zum Ersten, welche wichtige Rolle das 
Medium für die Herstellung eines Displays spielt. Gerade die - im Vergleich zum 
Medium Sprache - geringe Konventionalität von Musikende und Videostart er- 
schwert dem Regisseur, diese Handlungen als essenzielle Bestandteile für die 
Umsetzung seiner Instruktion zu erkennen. Dass er ihnen aber dennoch Display- 
charakter zuzuschreiben vermag, zeigt sich in seiner finalen Reaktion („DANke“, 
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Z. 007), als sowohl Musik als auch Video gestoppt sind. Der Fall zeigt zum Zwei- 
ten, dass wechselseitiges Monitoring eine zentrale Voraussetzung in Interaktions- 
situationen darstellt, ohne deren Analyse eine Rekonstruktion der Interaktion für 
Interaktionsforschende kaum möglich ist. Dies wird besonders im Vergleich zum 
folgenden Fall deutlich, in dem die Instruktion zwar vollständig verbal abstinent 
organisiert ist, die Beteiligten allerdings auf wechselseitiges Monitoring zurück- 
greifen können, wodurch eine sequenzanalytische Rekonstruktion möglich wird. 


4.2 Fall 2: vollständig verbal abstinente Instruktion 


In der zugrundeliegenden Sequenz instruiert der Regisseur (REG) die Regieassis- 
tentin (ASS) verbal abstinent, sie solle die laut im Hintergrund laufende Musik 
ausschalten. Unterdessen verfolgt er gleichzeitig das (sprachlich gestaltete) Ge- 
schehen auf der Bühne. Dort erarbeitet zu diesem Zeitpunkt eine Choreographin 
(CHO) gemeinsam mit einer Schauspielerin (SCW) und einem Schauspieler (SCM) 
einen Tanz. Diese Tanzerarbeitung wird im Folgenden nicht fokussiert, da die 
verbal abstinente Instruktionssequenz zwischen der Regieassistentin und dem 
Regisseur betrachtet wird. Sie ist aber nichtsdestotrotz im Transkript abgebildet, 
weil sie das sprachfrei gestaltete Display des Regisseurs motiviert und seine Auf- 
merksamkeit bindet. Im Verlauf dieser Sequenz kommt die Assistentin der An- 
weisung nach, was vom Regisseur visuell gemonitort wird. 
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as „Schauspielerin 


Regie- Be Regisseur 


assistenza 


Abb.10: REG hebt Hand ~ Abb.11: ASS greift nach Laptop 
(Kreis, schwarze Kontur) 


001 SCW *(so viel (.) siehste) 


002 SCM hä- 

003 SCW <<lacht>> 

004 CHO und irgendwann macht ihr den (AUCH gleich) 
weiter, 

005 SCW *joa:: (---) äh: (--) ja; 


006 CHO lasst uns#mal feststellenSwas ihr#HABT; 
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007 SCW Sja #geNAU; 


Schauspielerin ‚Schauspielerin 


= Regie- 


assistenz zn 


Abb. 14: ASS schraubt Flasche zu. 


008 CHO *also (--) ihr $LÄSST euch#+zeit, $%(-) 
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009 er +[beGUCKT dich, ] 
010 SCM [ja (.) geNAU; ] 
011 (1.0) 


012 CHO er DREHT sich, 
013 SCM ich DREH mich; 


a) Herstellung von Wahrnehmungswahrnehmung (Z. 001-007) - Die Schauspiele- 
rin und der Schauspieler arbeiten gemeinsam mit einer Choreographin an einem 
Tanz. Der Regisseur steht neben der Choreographin und folgt dem Geschehen, 
während die Regieassistentin am Regietisch sitzt und aus einer Flasche trinkt. Sie 
setzt die Flasche ab und beginnt sie zuzudrehen (Abb. 8), als die Choreographin 
mit „lasst uns mal feststellen was ihr HABT“ (Z. 006) eine Zusammenfassung des 
Tanzes projiziert, an der sich im weiteren Verlauf Schauspielerin und Schauspie- 
ler beteiligen (Z. 007-013). Parallel zum Start dieser Aktivität initiiert der Regis- 
seur eine Instruktion, die ohne sprachliche Beteiligungsweisen auskommt. Dazu 
nimmt er zunächst Blickkontakt mit der Regieassistentin auf, die weiterhin in der 
Endphase ihrer Trink-Aktivität (vgl. Hoey 2018) ihre Flasche zudreht. Da sie dies 
körperlich so organisiert, dass sie während des Zudrehens das Geschehen auf der 
Bühne monitoren kann (Abb. 8), kommt es zum Blickkontakt zwischen ihr und 
dem Regisseur (Abb. 9). Auf Grundlage dergestalt hergestellter, wechselseitiger 
Wahrnehmungswahrnehmung hebt der Regisseur seine rechte Hand (Abb. 10) 
und zeigt der Regieassistentin mit leicht gespreizten Fingern deren Innenseite (o- 
pen palm gesture, vgl. Kendon 2004, Kamunen 2018). 

Anhand dieser Situation werden zwei zentrale Aspekte verbal abstinenter In- 
teraktion deutlich: zum einen der idiosynkratische Gehalt multimodaler Ressour- 
cen (vgl. McNeill 1992: 37 £.), der zum anderen die isolierte Betrachtung solcher 
Ressourcen unmöglich macht (vgl. Deppermann 2013). Auch wenn vertical open 
palm gestures deutlich konventionalisierter sind als andere Gesten und zusätz- 
lich die fehlende Bewegungsdynamik der gehaltenen Hand ein Stopp-Signal na- 
helegt (vgl. für einen konventionalisierenden Ansatz von redebegleitenden Ges- 
ten Bressem/Müller 2014), wären für die Handgeste des Regisseurs mit den leicht 
gespreizten Fingern in dieser Situation durchaus andere Funktionen denkbar. 
Seine Geste könnte beispielsweise eine Grußpraktik darstellen, seine Anzeige für 
fünf Minuten Pause bedeuten oder ein Hinweis auf eine Notiz auf Seite 5 sein. Erst 
unter Einbezug der Reaktion der Adressatin wird deutlich, wie sie diese Geste ver- 
steht: als Anweisung, einen laufenden Musikvorgang zu stoppen. Obwohl also 
die Geste bereits formal nahelegt, dass die Regieassistentin etwas anhalten soll, 
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konkretisiert sich für sie der instruktive Gehalt des Regisseurdisplays erst unter 
Einbezug seiner Körperorientierung und seines Blickkontakts in Kombination 
mit der gehaltenen Geste innerhalb der aktuellen Arbeitssituation. 

b) Realisierung der instruierten Anweisung (Z. 008) - Im Anschluss an die 
Geste des Regisseurs lässt die Regieassistentin den Deckel ihrer (noch nicht voll- 
ständig zugedrehten) Flasche los und beugt sich dem Laptop entgegen (Abb. 11). 
Der Regisseur monitort diesen Orientierungswechsel der Assistentin, die ihm nun 
das Display ‚Arbeit am Laptop‘ im Rahmen der Instruktion anbietet. Mit diesem 
Display kann der Regisseur davon ausgehen, dass die Regieassistentin seine In- 
struktion als solche verstanden hat und im Begriff ist, die konditionelle Relevanz 
dieser als Paarsequenz organisierten Aktivität (Anweisung-Umsetzung) einzulö- 
sen, indem sie das Musikprogramm pausiert. Infolgedessen wendet er sich wie- 
der dem Monitoring des Geschehens auf der Bühne zu (Abb. 12). An dieser Stelle 
könnte die Instruktionssequenz beendet sein. Jedoch spielt die Musik unentwegt 
weiter, sodass der Regisseur sich wieder zur Regieassistentin umdreht (Abb. 13). 
Deren Display hat sich indes nicht verändert; sie ist weiterhin über den Laptop 
gebeugt und nutzt dessen integrierte Maus. Der Regisseur kann sich damit zu die- 
sem Zeitpunkt nicht sicher sein, ob die Regieassistentin wirklich an der Umset- 
zung seiner Anweisung arbeitet. Er behält sein Monitoring der Regieassistentin 
aufrecht, bis die Musik stoppt (Z. 008). Das Ausklingen der Musik fungiert für den 
Regisseur an dieser Stelle als Account, dass die Assistentin die Umsetzung abge- 
schlossen hat. Er wendet sich wieder dem Geschehen auf der Bühne zu, noch be- 
vor die Regieassistentin ihre multimodale Gestalt ‚Arbeit am Laptop‘ auflöst. 
Nach Abschluss der Instruktionsumsetzung monitoren beide Teilnehmende die 
laufende Tanzerarbeitung auf der Bühne, während die Regieassistentin gleich- 
zeitig ihre Flasche zudreht (Abb. 14) und sie schließlich wegstellt (Z. 011). 

Im Rahmen dieser Sequenz wechseln Regisseur und Regieassistentin im Mo- 
nitoring zwischen zwei laufenden Aktivitäten (Tanzerarbeitung auf der Bühne 
und verbal abstinente Instruktion). Sie monitoren dabei unter anderem die kör- 
perlichen Ressourcen, wie die anweisende Geste oder die Oberkörperorientie- 
rung, die als body torque (vgl. Schegloff 1998) zum einen den Wechsel zwischen 
den Aktivitäten anzeigt und zum anderen dem Regisseur als engagement display 
der Assistentin dient. Über das körperliche Display der Assistentin hinaus zeigt 
die Reaktion des Regisseurs auf die gestoppte Musik an, dass er dies als Account 
für den umgesetzten Status seiner Anweisung versteht. Das verdeutlicht noch ein- 
mal, dass Multimodalität in Interaktionen keinesfalls mit Körperlichkeit gleichge- 
setzt werden sollte. Körperlich realisierte Praktiken in Interaktionen sind in der 
Regel multimodal, aber nicht jede multimodal organisierte Interaktion benötigt 
zwingend eine körperliche Handlung, sondern kann auch wie hier auf einen wahr- 
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nehmbaren Zustand/Effekt nach dem Manipulieren von Schaltern/Geräten zu- 
rückgreifen. 

Anhand der Rekonstruktion der verbal abstinenten Instruktion wird deutlich, 
dass die Teilnehmenden auf die Verfahren des gegenseitigen Monitorings und wech- 
selseitigen Displays zurückgreifen, um diese Handlungssequenz aus verbal abs- 
tinenter Anweisung und verbal abstinenter Umsetzung herzustellen. Monitoring 
in Face-to-Face-Interaktionen ist - das illustriert bereits der vorherige Fall - so- 
mit zum einen eine Grundvoraussetzung für das Gelingen von kommunikativen 
Prozessen. Andererseits stellt Monitoring-Displays eine interaktive Beteiligungs- 
weise an der jeweiligen Aktivität dar (vgl. Müller & Bohle 2007). 

Indem also die Teilnehmenden füreinander multimodale Displays herstellen 
und diese monitoren, wird ein analytisches Zugriffsverfahren möglich, das nach 
der Logik des next turn proof procedure die Teilnehmendeninterpretation aus der 
Reaktion auf das vorher gemonitorte Display gewinnen kann. Dieses Vorgehen 
liegt den meisten sequenziellen Analysen von multimodalen Daten zugrunde, 
wird aber nicht immer konsequent durchgeführt, wenn verbale Displays analy- 
tisch einfacher fassbar sind als visuelle Displays. Dabei liegt die Stärke multimo- 
daler Interaktionsanalysen darin, dass sie die Komplexität menschlicher Interak- 
tion multimodal und sogar multisensorisch (vgl. Mondada 2019a) beschreiben 
kann. Von essenzieller Bedeutung bei diesem analytischen Zugang ist, die multi- 
modalen Ressourcen nicht isoliert zu betrachten, sondern als Teil eines multimo- 
dalen Pakets zu begreifen. Denn nicht die Handgeste des Regisseurs allein stellt 
die Anweisungshandlung her. Vielmehr bildet das Zusammenwirken der Ober- 
körperorientierung, des Blickkontakts und möglicherweise auch der Mimik als 
multimodale Gestalt ein Display, das eingebettet in den situativen Kontext der pro- 
jizierten Zusammenfassung des Tanzes (wozu keine Musik zur Bearbeitung be- 
nötigt wird) die Anweisung ‚Musik stoppen‘ relevant setzt (Abb. 10). 


5 Fazit: Teilnehmendeninterpretation verbal 
abstinenter Interaktionsbeiträge durch 
wechselseitige engagement displays 


In beiden Fällen leisten die Beteiligten kommunikative Arbeit, um mit den ihnen 
zur Verfügung stehenden Ressourcen wechselseitiges Monitoring zu ermöglichen 
und damit Wahrnehmungswahrnehmung herzustellen. Dies funktioniert im ers- 
ten Fall nur eingeschränkt, da die räumlichen und medialen Konfigurationen 
kein gegenseitiges Displaying und Monitoring ermöglichen. Der Inspizient kann 
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den Regisseur monitoren, ihm aber kein engagement display zur Verfügung stel- 
len. Im Gegenzug kann der Regisseur dem Inspizienten ein solches Display an- 
bieten, ihn aber nicht monitoren. Der Regisseur modifiziert seine verbal abstinen- 
ten Beteiligungsweisen darauf dahingehend, dass er sein Display audio-visuell 
erweitert, um bestenfalls gegenseitiges Monitoring zu erreichen. Dass er dies be- 
zogen auf den Inspizienten vollzieht, wird nicht nur in seiner auf diesen ausge- 
richteten Körperorientierung deutlich, sondern auch in seinen Reaktionen auf 
bestimmte Handlungen des Inspizienten, denen er einen Sinn zuschreibt. So be- 
handelt der Regisseur den unverständlichen verbalen Beitrag des Inspizienten 
zunächst als engagement display, bis anstelle des Ausblendens der Musik ein Vi- 
deo auf einer Leinwand abgespielt wird, was der Instruktion des Regisseurs wi- 
derspricht, worauf der Regisseur sein Instruktionsdisplay wiederherstellt. Dass 
der Regisseur die Sequenz nachträglich als Instruktion (und nicht etwa als Zu- 
fallsprodukt) rahmt, wird in seiner verbalen Evaluation deutlich, mit der er die 
IRE-Sequenz abschließt. Diese Evaluation fehlt im zweiten Fall und ergibt sich 
dortimplizit daraus, dass die Handlung der Regieassistentin durch den Regisseur 
nicht sanktioniert wird. In dieser Sequenz ermöglicht die räumliche Konstella- 
tion, dass die beiden Beteiligten einander monitoren und das Display des/der je- 
weils anderen visuell verfolgen können. Dies erzeugt einen interaktionalen Rah- 
men, in dem Teilnehmende dem Display der anderen Teilnehmenden einen Sinn 
zuschreiben können und ihre Interpretation dieser Zuschreibung als Teilnehmen- 
deninterpretationen anzeigen können. Unter dieser Voraussetzung lassen sich 
auch Aktivitäten ohne verbale Komponente als aufeinander bezogen konversati- 
onsanalytisch rekonstruieren. 

An seine Grenzen stößt dieses Verfahren immer dann - das haben beide Fälle 
gezeigt - wenn den Teilnehmenden kein engagement display des anderen zur Ver- 
fügung steht. Dies ist im ersten Beispiel durchgängig für das Display des Inspizi- 
enten der Fall und lässt sich im zweiten Beispiel wiederfinden, wenn die Regie- 
assistentin der Instruktion am Laptop nachkommt, der Regisseur den Fortschritt 
der response aber nicht monitoren kann. In beiden Fällen zeigt der Regisseur an 
diesen Stellen Kontrollblicke zur instruierten Person, die deutlich werden lassen, 
dass er versucht, Informationen über das ihm angebotene Display einzuholen. 
Dies wird daran deutlich, dass sich der Regisseur in seinem kommunikativen Ver- 
halten erst verändert, als auch eine Veränderung im Display der instruierten Per- 
sonen hinsichtlich eines eindeutigen engagement displays ergeben hat. In beiden 
Fällen wird dies durch das hörbare Stoppen der Musik markiert und zieht jeweils 
eine Modifikation im engagement display des Regisseurs nach sich: Im ersten Fall 
erfolgt nach Umsetzung der Instruktion die Evaluation, bevor der Regisseur sich 
an die Schauspielenden wendet. Im zweiten Fall bleibt die Evaluation aus, dafür 
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zeigt der Regisseur der Regieassistentin ein disengagement display, indem er das 
Geschehen auf der Bühne monitort. Verbal abstinente Handlungen werden dem- 
nach also immer nur dann aufeinander bezogen rekonstruierbar, wenn den Teil- 
nehmenden ein engagement display der Ko-Interagierenden zur Verfügung steht. 
Fehlt dieses, kann zwar das körperliche Verhalten beschrieben werden, jedoch 
ohne feststellen zu können, als welche Handlungen die Teilnehmenden das Tun 
der anderen verstehen. 

Der analytische Zugriff auf verbal abstinent organisierte Interaktionen ist 
also nur dann möglich, wenn die Teilnehmenden füreinander Displays herstellen 
und erkennen lassen, dass sie diese auch monitoren. Auch wenn dies nicht in 
jedem Fall eine Wahrnehmungswahrnehmung nach sich ziehen muss, lässt sich 
damit gemäß der Logik eines next action proof procedure die Teilnehmendenin- 
terpretation aus der Reaktion auf das vorher gemonitorte Display gewinnen. Fol- 
gen mehrerer solcher Reaktionen aufeinander, ermöglicht das eine an das sequenz- 
analytische Vorgehen der Konversationsanalyse angelehnte Rekonstruktion der 
gegenseitigen Sinnzuschreibung der Teilnehmenden. Wichtig ist dabei, die Dis- 
plays als multimodale Gestalten (vgl. Mondada 2014) zu begreifen, bei der keine 
einzelnen multimodalen Ressourcen isoliert werden, sondern als ein Zusammen- 
wirken der verschiedenen Modalitäten betrachtet werden. 

Die Verwendung multimodaler Gestalten als Analysegrundlage scheint im 
Vergleich zu sprachlichen Accounts zunächst zu deutlich weniger gesicherten 
Annahmen zu führen, als linguistisch orientiere Konversationsanalytiker/innen 
dies oftmals gewohnt sind (vgl. Küttner 2014). Orientiert man sich jedoch an der 
emischen Perspektive der Teilnehmenden, wird deutlich, dass es sich auch für 
die Interagierenden um ein praktisches Problem handelt, da sie - unabhängig 
davon, inwiefern eine Interaktion sprachlich oder sprachfrei organisiert ist — im- 
mer nur auf die Displays der Ko-Teilnehmenden reagieren können, denen sie im 
Zuge eines immer wiederkehrenden Et-cetera-Prinzips (Garfinkel 1967) einen Sinn 
zuschreiben und dies in ihren Reaktionen anzeigen. Somit erwächst aus dem schein- 
baren analytischen Problem ein methodisch konsistenter Zugriff auf sprachfrei or- 
ganisierte Interaktionen. 

Der Beitrag zeigt zum einen, wie die bestehende konversationsanalytische 
Methodologie zur Analyse verbal abstinenter Interaktionen aktuell erweitert wird 
und werden kann. In diesem Rahmen ist es Forschenden möglich, über die wech- 
selseitigen koordinativen Verfahren des Monitorings und Displayings auch sprach- 
freie Interaktionssequenzen analytisch zu erfassen. Zum anderen wird mit dem 
Beitrag der Versuch unternommen, die Grenzen dieses Analysezugriffs auszulo- 
ten: Erstens sind Rekonstruktionen sprachfreier Interaktionen nur dann möglich, 
wenn die Teilnehmenden gegenseitiges Monitoring erkennen lassen. Zweitens 
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fehlt nicht-sprachlichen Displays der Grad der Konventionalisierung, der sprach- 
lichen Displays immanent ist, was (bereits auf der Ebene der Akteure/innen; vgl. 
Fall 1& 2) zu Missverständnissen führen kann. Ex negativo ermöglicht das einen 
Blick auf die spezifische Funktion, die Sprache in diesem Zusammenhang erfül- 
len kann: nämlich bspw. Partizipation und auditives Monitoring in solchen Situ- 
ationen anzuzeigen, in denen Teilnehmende einander kein visuelles Display zur 
Verfügung stellen können (wie in Arbeitssituationen, die kein wechselseitiges vi- 
suelles Monitoring ermöglichen; vgl. Fall 1). 


Danksagung: Ich bedanke mich bei den Herausgebern und einer/m anonymen 
Reviewer/in für die hilfreichen Hinweise und Kommentare zu diesem Beitrag. 
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Abstract: Dieser Beitrag gibt einen Überblick über die methodischen Ausgangs- 
punkte des Projekts MIT.Qualität und stellt einige zentrale Erkenntnisse zur Mo- 
dellbildung, der korpuslinguistischen Analyse und Akzeptabilitätserhebungen in 
der Sprachgemeinschaft vor. Wir zeigen dabei, wie bestehende Textqualitätsmo- 
delle anhand einer Analyse einschlägiger Ratgeberliteratur erweitert werden kön- 
nen. Es wurden zwei empirische Fallstudien durchgeführt, die beide auf die Her- 
stellung von textueller Kohärenz mittels des Kausalkonnektors weil fokussieren. 
Wir stellen zunächst eine korpuskontrastive Analyse vor. Weiterhin zeigen wir, 
wie man anhand verschiedener Aufgabenstellungen diverse Aspekte von Akzep- 
tabilität in der Sprachgemeinschaft abprüfen kann. 
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1 Einleitung 


Wir gehen von der Beobachtung bzw. der immer wieder vorgetragenen These aus, 
dass Schreibprodukte im Internet bzw. — weiter gefasst - in digitalen Kommuni- 
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kationsmedien nicht immer den normativen Erwartungen entsprechen, die man 
an redigierte Schrifttexte heranträgt. Ob und wie sich dies langfristig auf die 
Schriftsprache im Allgemeinen und auf die Schreibkompetenzen der mit digita- 
len Medien sozialisierten Bevölkerung im Besonderen auswirkt, ist eine offene 
Frage. Es sind zwei Tendenzen denkbar, wie diese Frage beantwortet werden 
kann. Deuten wir sie sprachpessimistisch, würden wir behaupten, dass die Ab- 
weichungen von schriftsprachlichen Standards in der Internetkommunikation An- 
zeichen für den Verfall von Schreibfähigkeiten und Sprachkultur seien. Gleich- 
zeitig würde damit implizit davon ausgegangen, dass die Schreiberinnen und 
Schreiber ihren Schreibstil immer weniger an verschiedene Kommunikationsfor- 
men bzw. -situationen anpassen könnten. Die sprachoptimistische Deutung wür- 
de hingegen lauten, dass internetbasierte Kommunikationsformen eine interak- 
tionsorientierte Haltung zum Schreiben förderten. Sie erweiterten somit eher 
unsere schriftsprachlichen Handlungsmöglichkeiten und das Repertoire an text- 
orientiertem Schreiben. Das normgerechte Verfassen von redigierten Texten wür- 
de also nicht ersetzt, sondern durch die Fähigkeit ergänzt, in unterschiedlichen 
Interaktionssituationen jeweils angemessene schriftliche Sprachhandlungen 
durchzuführen (vgl. Storrer 2014). Beim interaktionsorientierten Schreiben wäre 
das die Möglichkeit zur schnellen Reaktion, Verstehensprobleme direkt zu bear- 
beiten und den schnellen Wechsel zwischen Produzierenden und Rezipierenden 
zu fokussieren. 

Wir folgen hier zunächst keiner der beiden Positionen, sondern behaupten, 
dass die wissenschaftlichen Voraussetzungen dafür, die Frage nach möglichen 
Auswirkungen des Schreibens in digitalen Kommunikationsmedien auf Schrift- 
sprache bzw. Sprachkompetenzen sprachpessimistisch oder sprachoptimistisch 
zu beantworten, noch gar nicht geschaffen sind, weil an drei entscheidenden 
Stellen noch wissenschaftlicher Nachholbedarf besteht: auf Seiten der Modellbil- 
dung, also der geeigneten Kategorien, des verfügbaren Materials und in Bezug 
auf die Methoden, die eingesetzt werden, um dieses Material im Rahmen des Mo- 
dells auszuwerten und zu interpretieren. 

Das vorrangige Ziel des Projekts „MIT.Qualität - Wie misst man Textqualität 
im digitalen Zeitalter“ ist es, die Voraussetzungen dafür zu verbessern, den Wan- 
del von Schreibgebrauch und Schreibkompetenzen durch digitale Medien wis- 
senschaftlich zu untersuchen.‘ Es ist insbesondere als ein methodologisches Pro- 


1 Vgl. Abel et al. (2019). Das Projekt wurde im Rahmen der Förderlinie „Originalitätsverdacht? 
Neue Optionen für die Geistes- und Kulturwissenschaften“ der Volkswagenstiftung von Dezem- 
ber 2017 bis Mai 2019 gefördert. Ausführliche Informationen zum Projekt, seinen Mitarbeiter*in- 
nen und einen Projektblog mit Posts zu den Ergebnissen und verwandten Themen findet man 
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jekt zu verstehen, denn - wie oben bereits angekündigt - nicht die Untersuchung 
des Kompetenzwandels selbst steht im Vordergrund, sondern die Entwicklung, 
Erprobung und Evaluation von Methoden, die hierzu herangezogen werden kön- 
nen. An der Auffassung von Sprache als durch die Gemeinschaft der Sprechen- 
den geformtes fluides System, dem bestimmte Einstellungen aus eben dieser Ge- 
meinschaft entgegengebracht werden, ändert diese methodologische Sichtweise 
nichts, sondern sie schlägt sich hauptsächlich in der Einteilung der beiden Ar- 
beitsbereiche nieder. Im Bereich „Modellbildung und Kategorienfindung“ wird 
ein Modell zur Bewertung von Textqualität entwickelt, das traditionelle Ansätze 
zur Textbewertung mit Blick auf die Eigenschaften digitaler Kommunikation (So- 
zialität, Vernetztheit, Multimodalität, Algorithmisierung usw., vgl. Storrer 2020) 
erweitert. Angelika Storrer schreibt dazu in unserem Projektblog: „‚Wie‘ [im Pro- 
jekttitel „Wie misst man Textqualität im digitalen Zeitalter“] ist also im Sinne von 
‚mit welchen Maßstäben, mit welchen Kategorien misst man Textqualität?‘ zu 
verstehen.“? Dieser Ansatz ist sowohl deduktiv zu verstehen, da von bestehenden 
Modellen ausgegangen wird, hat aber auch induktive Anteile, da beobachtungs- 
basiert neue Kategorien hinzugefügt werden sollen. Maßstäbe sind hierbei - 
Nussbaumer & Sieber (1994) folgend - als „systematische[r] Katalog von Fragen“ 
zu verstehen, „die man an einen konkreten Text stellen kann und muss, wenn 
man zu einer differenzierten Sicht des konkreten Textes gelangen will“ (Nussbau- 
mer & Sieber 1994: 141). 

Im zweiten Bereich explorieren wir verschiedene Methoden in Form von Fall- 
studien, die die Messbarkeit ausgewählter Aspekte von Textqualität fokussieren. 
„Das ‚Wie‘ wird hierbei bearbeitet als ‚mit welchen Methoden, auf welcher Daten- 
grundlage misst man Textqualität?‘“ (Blogbeitrag Storrer). 

Wir nähern uns aus drei Richtungen dem Gegenstand Sprache in digitalen 
Kommunikationsmedien: i) begrifflich im Rahmen der Modellbildung und Kate- 
gorienfindung, empirisch ii) anhand von bereits vorhandenen Korpusdaten und 
iii) in der Heranziehung von Einschätzungen aus der Sprachgemeinschaft. Orga- 
nisatorisch bilden sich diese Richtungen auf die drei kooperierenden Institutio- 
nen ab: die germanistische Linguistik an der Universität Mannheim (Angelika 
Storrer, Maja Linthe), das Institut für Angewandte Sprachforschung von Eurac 
Research in Bozen (Andrea Abel, Aivars Glaznieks, Jennifer-Carmen Frey und 
Lisa Appelmann) und das Leibniz-Institut für Deutsche Sprache in Mannheim 


unter https://mitqualitaet.com/category/neues-vom-projekt-mitqualitaet [letzter Zugriff am 
4.1.2023]. 

2 Der Blogbeitrag ist abrufbar unter https://mitqualitaet.com/2019/10/15/ein-modell-fur-die- 
bewertung-von-textqualitat-in-sozialen-medien [letzter Zugriff am 20.12.2022] 
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(Carolin Müller-Spitzer, Maria Ribeiro Silveira und Sascha Wolfer). Auch die Glie- 
derung des vorliegenden Beitrags orientiert sich an der Trias Modell - Korpus - 
Sprachgemeinschaft: Im folgenden Abschnitt 2 werden wir die Zielsetzungen der 
Modellbildung und das Vorgehen bei der Kategorienfindung vorstellen. Ab- 
schnitt 3 präsentiert eine korpuslinguistische Pilotstudie aus dem Projekt. In Ab- 
schnitt 4 werden wir die Erhebung der intuitiven Einschätzungen aus der Sprach- 
gemeinschaft motivieren. Abschnitt 5 schließt den Beitrag mit einem zusammen- 
fassenden Fazit ab. 

Der Schwerpunkt dieses Beitrags liegt dabei auf den methodologischen As- 
pekten des Projekts, da die einzelnen Ergebnisse an anderer Stelle ausführlicher 
nachgelesen werden können (vgl. Abel & Glaznieks 2020a, Linthe 2020, Storrer 
2020, Wolfer et al. 2020). 


2 Modellbildung und Kategorienfindung 


Der Bereich Modellbildung und Kategorienfindung wurde vom Team der Univer- 
sität Mannheim bearbeitet.’ Im Sinne des Chartres’schen Zitats „Zwerge auf den 
Schultern von Riesen“ soll das Modell zur Bewertung von Textqualität im Rah- 
men digitaler Kommunikation nicht von Grund auf neu entwickelt werden. Viel- 
mehr wurden bestehende Ansätze zur Textbewertung „traditioneller“ Texte mit 
Blick auf die Eigenschaften digitaler Kommunikation erweitert. Insbesondere 
knüpften wir an das Zürcher Textanalyseraster (Nussbaumer 1991) und den An- 
satz von Bartz (2019) an. Das Zürcher Raster wurde primär für die Analyse von 
Schülertexten erstellt. Digitale Texte blieben dort noch unberücksichtigt. Sieber 
(2008) weist aber auf das Phänomen Parlando als „eine Veränderung kommuni- 
kativer Grundmuster der Schriftlichkeit“ hin. Er benannte dafür folgende drei 
Merkmale: die Thematisierung eigener Erfahrungen, hohe Ansprüche an Direkt- 
heit und Authentizität und eine starke Orientierung an Mustern der Mündlichkeit 
(vgl. Sieber 2008: 284). Die Unterkategorie B1 (Funktionale Angemessenheit) des 
Zürcher Rasters enthält u.a. auch Textmusternormen, für die wir einen neuen Teil- 
bereich „Plattformspezifik“ innerhalb der Kategorie „Mediale Passung“ unseres 
Modells vorschlagen. Hier sollen die Ermöglichungen und Beschränkungen (af- 
fordances und constraints, vgl. Marx & Weidacher 2014: 57 f.) der jeweiligen Platt- 


3 Anden Arbeiten war neben Angelika Storrer (Projektleitung, Modellbildung) und Maja Linthe 
(Kategorienfindung) auch Leonie Bröcher (Evaluation automatisierter Textbewertungstools) be- 
teiligt. 
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formen aufgeführt werden, um die unterschiedlichen, spezifischen Normen der 
einzelnen Plattformen bei der Analyse ebenfalls berücksichtigen zu können. 

Hintergrund ist u.a. unsere Beobachtung, dass es in der Tat recht einfach ist, 
in der Internetkommunikation vom Schriftstandard abweichende Schreibungen 
zu finden, wenn man bspw. die aktuell im Duden festgehaltenen Schreibweisen 
als Standard voraussetzt. Bei dieser Beobachtung kann man allerdings nicht ste- 
henbleiben, denn die Bewertung, ob es sich dabei wirklich um Kompetenz- oder 
eher um Performanzfehler handelt, ist weitaus schwieriger. Performanzfehler kön- 
nen bspw. durch schnelles Tippen (ggf. auf einer Smartphone-Tastatur) oder un- 
redigiertes Verschicken des Textes entstanden sein. Darüber hinaus können Ab- 
weichungen gar computergeneriert sein. Potentielle Quellen von Abweichungen 
stellen hier Autokorrekturprogramme und andere digitale Schreibhilfen dar. 
Selbst die vorgelagerte Bewertung, ob es sich überhaupt um einen „Fehler“ han- 
delt, ist nicht leichtfertig vorzunehmen. Abweichungen vom Schriftstandard kön- 
nen auch bewusst gewählt worden sein - sei es, um Mündlichkeit zu fingieren, 
einen bestimmten Soziolekt zu bedienen oder kreativ mit Sprache zu spielen 
(oder eine Mischung aus allem). All dies kann in bestimmten Kommunikations- 
kontexten gewünscht sein und einen „Fehler“ rechtfertigen. 

Grundsätzlich gehen wir von der Annahme aus, dass zwischen Richtigkeit 
und Angemessenheit einer sprachlichen Äußerung getrennt werden muss. Damit 
folgen wir dem Zürcher Textanalyseraster (u.a. beschrieben in Nussbaumer 1991), 
das wiederum Kategorien der antiken Rhetorik aufgreift, wo ebenfalls eine Un- 
terscheidung vorgenommen wird in Richtigkeit (recte dicendi) und Angemessen- 
heit (bene dicendi). Inwieweit die Mitglieder der Sprachgemeinschaft (also lingu- 
istische Laiinnen und Laien) in der Lage sind, diese beiden Konzepte zu unter- 
scheiden bzw. wie zugänglich die mentale Unterscheidung für die linguistische 
Methodik ist, werden wir in Abschnitt 4 diskutieren. Unser Modell soll, ähnlich 
dem Zürcher Modell für linear organisierte stabile Ganztexte, dazu anleiten, mul- 
timodale Hypertexte und internetbasierte Interaktion qualitativ einzuschätzen. 
Dazu wurde das Zürcher Modell um drei Bereiche erweitert, die die Vernetzung, 
die Multimodalität und die Automatisierung betreffen. Der Bereich der Bezugs- 
srößen und Daten des Zürcher Modells wurde um den Teilbereich automatisch 
generierter Daten, der Bereich Richtigkeit um den Teilbereich nicht-sprachlicher 
Einheiten und der Bereich Angemessenheit um den Teilbereich interaktionaler 
und multimodaler Kohärenz sowie medialer Passung (Textmusternormen in So- 
zialen Medien) erweitert. 

Der Schwerpunkt des Modells liegt dabei auf der Erweiterung der funktiona- 
len Angemessenheit, Verständlichkeit und Kohärenz. Im nicht-linearen Hyper- 
text sind die Wissensbestände der Rezipierenden häufig so wenig eindeutig wie 
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seine Rezeptionspfade. Hyperlinks und multimodale Ressourcen als digitale Ko- 
härenzbildungshilfen sowie die mediale Passung können bei der Rezeption den 
Weg weisen und ihm das Textverständnis erleichtern. Bei den Hyperlinks unter- 
scheidet das Modell zwischen internen und externen Links, zwischen Struktur- 
und Inhaltslinks sowie zwischen der Link-Kennzeichnung, der Link-Explikation 
und der Link-Positionierung. Auch in der interaktionalen Kohärenz kann die Ko- 
härenzplanung nur den bisherigen Interaktionsverlauf berücksichtigen. Dieser 
kann, bedingt durch die Tatsache, dass häufig mehrere Beiträge gleichzeitig ver- 
fasst werden, in Unordnung sein und eine Kohärenzplanung in der Interaktion 
erschweren. Links können hier dazu eingesetzt werden, um für die Interaktion 
benötigtes Wissen schnell zu vermitteln. Viele neue Konventionen, wie z.B. die 
Adressierung durch das @-Zeichen haben sich daraufhin entwickelt, die auch im 
Teilbereich „Mediale Passung“ berücksichtigt werden. Im Teilbereich „Multimo- 
dale Kohärenz“ unterscheidet das Modell zwischen dem Bezug des Bildes zur 
Bildunterschrift und dem Bezug des Text-Bild-Clusters zum Fließtext. Auch hier 
ergeben sich Fragen nach dem zusätzlichen Informationsgehalt oder der Beto- 
nung einzelner Bildaspekte, die dann ebenfalls im Bereich „Mediale Passung“ als 
Qualitätsvorstellungen beim Schreiben in den Sozialen Medien wieder aufgegrif- 
fen werden. 

Eine Metapher, von der wir uns bei der Erarbeitung des Modells leiten ließen, 
ist der Brückenschlag, und zwar von den angesprochenen traditionellen Katego- 
rien der Qualitätsbewertung hin zu innovativen Kategorien, die speziell für die 
Qualitätsbewertung von Texten in Sozialen Medien relevant sind. Da Kategorien 
wie Richtigkeit, Angemessenheit und Relevanz auch für Texte in den Sozialen 
Medien weiterhin von Bedeutung sind, ist der gut befestigte Brückenkopf auf der 
Seite bekannter Kriterien Ausgangspunkt und Stütze für den „Neubau“ der Brü- 
ckein das noch weniger erforschte Gebiet des Schriftsprachgebrauchs wie er z.B. 
in Chats, WhatsApp oder auf Social-Media-Plattformen sichtbar wird (neueste 
Beiträge zum Thema finden sich z.B. in den Sammelbanden von Androutsopou- 
los & Busch 2020 und Marx, Lobin & Schmidt 2020). Hierbei müssen neue digitale 
Zeichentypen wie Emojis, GIFs etc. sowie neuartige Vernetzungsmittel wie Links, 
Hashtags und Adressierungen anderer Nutzerinnen und Nutzer erfasst werden. 
Es sollen — wie oben für das Zürcher Raster bereits erwähnt - keine starren Nor- 
men formuliert werden, sondern eine Hilfestellung gegeben werden, die uns da- 
bei unterstützt, geeignete Fragen an einen Text zu stellen, um ihn für eine Ana- 
lyse (mit nachgeschalteter Bewertung des Gesamttextes auf der Basis aller Kate- 
gorien) zugänglich zu machen. 

Eine besondere Herausforderung stellt dabei die fluide Natur des nur wenig 
kartierten Bereichs dar: Funktionalität, Schreibtradition und -konvention unter- 
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scheiden sich nicht nur über Plattformen hinweg (Facebook ist ungleich Insta- 
gram ist ungleich Twitter), sondern auch plattforminhärent. Diese Binnendiffe- 
renzierung von Plattformen gilt sowohl zeitlich (Twitter 2020 ist ungleich Twitter 
2015) als auch über verschiedene Gruppierungen von Userinnen und Usern hin- 
weg („Schmunzeltwitter“ ist ungleich Politiktwitter ist ungleich Literaturtwitter). 

Woher kommen die Kategorien, die wir im Modell für den Bereich der digita- 
len Kommunikation ansetzen können? Um in der Metapher zu bleiben: Worauf 
und woraus bauen wir die neue Brücke? Eines ist klar: Ziel des Projekts ist es 
nicht, eine fertige Brücke zu bauen, die über Jahrzehnte hinweg den Weg in die 
Landschaft Sozialer Medien ebnet. Solch ein statisches Gebilde würde auch kaum 
der oben skizzierten Fluidität der zu beschreibenden linguistischen Landschaf- 
ten Genüge tun. Ziel ist es — wie in der Einleitung bereits beschrieben - Wege 
aufzuzeigen, wie diese Beschreibung methodisch geschehen kann. Im Arbeitsbe- 
reich „Kategorienfindung“ unseres Projekts haben wir daher unter anderem auf 
eine Inhaltsanalyse von Ratgeberliteratur zurückgegriffen, die sich explizit mit 
Social-Media-Kommunikation beschäftigt und deren Ergebnisse sich im Teilbe- 
reich „Mediale Passung“ unseres Modells wiederfinden. Das Vorgehen bei der 
Analyse, die detaillierten Ergebnisse sowie eine Liste der analysierten Ratgeber 
sind u.a. in unserem Projektblog im Beitrag von Maja Linthe im Detail einsehbar.“ 
Wir interessierten uns hierbei einerseits für die Überschneidungsbereiche mit 
etablierten Analysewerkzeugen wie dem Zürcher Textanalyseraster, andererseits 
aber auch speziell für jene Bereiche, die in der Ratgeberliteratur neu hinzutreten 
oder - im Gegensatz zum Zürcher Raster - gar nicht besprochen werden. Das Kor- 
pus besteht aus zwölf Ratgebern, die mindestens zwei der folgenden drei Krite- 
rien erfüllen: i) Aktualität: neuere Veröffentlichung, ii) in den Ratgebern sollten 
nicht nur technische Hinweise gegeben werden, sondern auch konkrete Vor- 
schläge zum Schreiben von Texten, iii) die Ratgeber sollten außerdem verschie- 
dene Plattformen bezüglich ihrer Ermöglichungen und Beschränkungen (affor- 
dances und constraints) berücksichtigen. 

Wir gingen in zwei Schritten vor. Zunächst erschlossen wir uns das Material 
anhand einer Probeanalyse von drei Ratgebern (Broschart & Monschein 2017, 
Forst 2016, Heijnk 2011). Mithilfe der qualitativen Inhaltsanalyse durchsuchten 
wir das Material. Dabei achteten wir darauf, inwieweit traditionelle Kategorien 
des Zürcher Rasters in der Ratgeberliteratur für Social-Media-Texte berücksich- 
tigt werden und - dieser Frage galt unsere besondere Aufmerksamkeit — welche 
neuen Textqualitätskategorien hinzugekommen sind. Wie oben bereits angeris- 


4 Abrufbar: https://mitqualitaet.com/2019/10/15/das-projekt-mit-qualitat-kategorienfindung- 
und-neue-textqualitaten-fur-social-media-texte/ [zuletzt abgerufen am 20.12.2022] 
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sen: Die Kriterien verstehen wir mit Nussbaumer & Sieber (1994) als „Fragen an 
den Text“, die zunächst eine Analyse anleiten, welche dann auch zu einer ab- 
schließenden Bewertung des Textes führen kann. Eine Kodiererin extrahierte zu- 
nächst aus der Korpus-Teilmenge von drei Ratgebern neue Kategorien, die von 
zwei weiteren Kodiererinnen an je einem dieser Ratgeber auf Verständlichkeit 
und Anwendbarkeit geprüft wurden. Die Ergebnisse wurden anschließend im 
Team diskutiert. Auf der Basis der gefundenen neuen Kategorien erarbeiteten wir 
ein endgültiges, verbessertes Kategorienraster, dem auch Kategorien aus dem 
Zürcher Raster angehörten. 

Bei dieser Überarbeitung berücksichtigten wir sowohl die Textsorte der Rat- 
geberliteratur als auch die Betonung marktwirtschaftlicher Aspekte in den Rat- 
gebern. Wir haben uns für die Analyse von Schreibratgebern entschieden, weil 
darin Expertinnen und Experten zeitnah ihre langjährigen praktischen Erfahrun- 
gen mit den sich ständig wandelnden Praktiken in den Sozialen Medien mit ih- 
rem Publikum teilen und ausführlich darüber Auskunft geben, wie denn, ihrer 
Meinung nach, ein guter Social-Media-Text auszusehen habe. Marktwirtschaftli- 
che Aspekte bei der Textqualität sind nicht mehr nur für Unternehmen relevant, 
sondern dank moderner Analysetools und Statistiken mittlerweile auch für privat 
geführte Social-Media-Accounts von Interesse. Die Analyse von Schreibratgebern 
sollte es uns, unter Berücksichtigung der Textsorte, ermöglichen, den Wandel der 
Textqualitätskategorien, der in den Sozialen Medien stattgefunden hat, nachzu- 
vollziehen. Die für den Teilbereich „Mediale Passung“ auf diese Art und Weise 
neu gewonnenen Analysekategorien sind neben der Plattformspezifik die Einbet- 
tung des Textes in die Webseite, die Multimodalität, Interaktion, Schnelligkeit, 
Vernetzung und Verlinkung, Professionalität/Authentizität und das Gefunden- 
Werden. 

Die eigentliche Bewertung der Textqualität kann häufig erst nach der voll- 
ständigen Analyse unter Einbeziehung aller Analysekategorien des Rasters erfol- 
gen. So kann z.B. der Verzicht auf die Adressierung eines politischen Gegners 
oder auch auf die Anzeige der Followeranzahl unter Umständen von besonderer 
Kompetenz zeugen, was jedoch erst in der Gesamtbetrachtung ersichtlich wird. 

Die Übernahme einer Kategorie aus der Ratgeberliteratur stellt zunächst ein- 
mal keine Bewertung dar. So ist es z.B. nicht grundsätzlich ein Qualitätsmerkmal, 
viele „Likes“ zu haben, es gehört aber z.B. in Blogs zu den „Ermöglichungen“, 
diese Likes anzeigen zu lassen. Genauso bedeutsam ist es jedoch, wenn die Schrei- 
benden das nicht tun, obwohl sie die Möglichkeit dazu hatten. In diesem Fall 
stellt es einen bewussten Verzicht dar, der nur sichtbar wird, wenn wir einen Text 
überhaupt auf diese Kategorie hin untersuchen. Erst in der Gesamtheit der Ana- 
lyse kann das ermittelt und benannt werden, was Sieber (2008) die Wegequalität 
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des Textes nannte, was bedeutet, dass die Schreibenden die Rezipierenden an 
einem bestimmten Punkt abholen und eine bestimmte Strecke des Textweges 
führen. 

Als Arbeitsmaterial wurden die aus dieser Probeanalyse abgeleiteten Leitfra- 
gen in einem Annotationshandbuch für die Analyse aller Schreibratgeber zusam- 
mengefasst. Dieser Schritt hatte die Herstellung von Intersubjektivität zum Ziel — 
wie bei jeder Erarbeitung von Annotationsrichtlinien sollte durch dieses Vorge- 
hen insbesondere sichergestellt werden, dass spätere Ergebnisse nicht nur auf 
Einschätzungen einer ganz bestimmten Person beruhen, sondern eine vom be- 
wertenden Individuum weitestgehend unabhängige Bewertung des Quellmateri- 
als möglich wird. 

Im zweiten Schritt wurde das auf diese Weise erarbeitete Analyseinstrumen- 
tarium an allen Ratgebern angewendet. Die Kodiererinnen wurden mithilfe des 
Annotationsschemas geschult, um die Interkodier-Reliabilität zu erhöhen. Ein- 
fach ausgedrückt: Alle beteiligten Mitarbeiterinnen sollten unter den formulier- 
ten Kategorien auch das Gleiche verstehen. Auch Zweifel und Unsicherheiten sol- 
lten notiert werden, um sie später im Team zu diskutieren. 

Die Kodierergebnisse für alle Ratgeber wurden zuletzt in einer zusammenfas- 
senden Darstellung zusammengetragen, um einen Überblick zu gewinnen, wel- 
che zuvor definierten Kategorien besonders stark in den verschiedenen Ratge- 
bern hervortreten und welche kaum oder gar nicht behandelt werden. Die ab- 
schließenden Ergebnisse werden in Linthe (2020) vorgestellt. Auffällig war unter 
anderem, dass die sprachsystematische/orthographische Richtigkeit der Sprach- 
mittel vergleichsweise wenig Raum in den Ratgebern einnimmt oder gar als 
zweitrangig oder unwichtig bezeichnet wird. Auch ästhetische Angemessenheit 
findet kaum Erwähnung. Dies steht im Kontrast zur vergleichsweise häufigen 
Nennung von Prinzipien der Suchmaschinenoptimierung (search engine opti- 
mization, SEO) oder dem Konzept der Glaubwürdigkeit in Social-Media-Texten. 
Insbesondere die Relevanz der Suchmaschinenoptimierung ist wohl der Text- 
sorte der Ratgeber geschuldet. Andere Textsorten, wie bspw. Netiquetten, wür- 
den hier wohl andere Ergebnisse liefern, waren aber bisher nicht Gegenstand un- 
serer Betrachtungen. Diese Auswertungen zur Ratgeberliteratur fließen in einen 
der neuen Teilbereiche unseres Modells ein, den wir mit „Mediale Passung“ über- 
schrieben haben. 

Der Schwerpunkt des Modells liegt, wie oben erwähnt, auf der funktionalen 
Angemessenheit, Verständlichkeit und Kohärenz. Ausgehend vom Teilbereich 
Verständlichkeit/Kohärenz im Bereich „Angemessenheit“ des Zürcher Textana- 
lyserasters haben wir die multimodale und interaktionale Kohärenz als weitere 
Teilbereiche unseres Modells neu eingeführt. Hier geht es darum, Kohäsions- 
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mittel wie Links, Hashtags, Mentions usw. in ihrer Vielfältigkeit und Anwendung 
adäquat zu beschreiben. Auch geht es weiterhin um ganz „klassische“ Mittel der 
Kohärenzbildung, die auch in digitalen Schreiberzeugnissen relevant sind. Daher 
haben wir im Projektbereich der Methodenexploration sowohl für die Korpusstu- 
dien als auch für die Befragung der Sprachgemeinschaft entschieden, ein für tra- 
ditionelle Medien gut erfasstes Phänomen in den Fokus zu rücken: den Einsatz 
von Konnektoren. Im Rahmen dieses Beitrags beschränken wir uns auf die Dar- 
stellung der Methodik und der Ergebnisse zum Kausalkonnektor weil. 


3 Korpuslinguistische Studien 


Die Ausgangsfrage der Analysen ist - generell gesprochen - ob Konnektoren in 
dialogischen Online-Texten anders verwendet werden als in traditionellen mono- 
logischen Texten. Dialogische Online-Texte werden spontan im jeweiligen Kom- 
munikationszusammenhang produziert und rezipiert und sind normalerweise 
kürzer. Das heißt, dass sie meist nicht mit der Intention geschrieben werden, dass 
sie unabhängig von der jeweiligen Kommunikationssituation verstanden werden 
können, wie das bei monologischen Texten üblicherweise der Fall ist. Sie sind 
vielmehr Teil eines fortlaufenden kommunikativen Austausches. Aufgrund die- 
ses unterschiedlichen Schreibanlasses (und der damit verbundenen Schreibhal- 
tung, d.h. interaktionsorientiertes vs. textorientiertes Schreiben im Sinne von Stor- 
rer 2013: 337) gehen wir davon aus, dass der Gebrauch von Konnektoren in sol- 
chen Online-Texten vom Einsatz in monologischen Texten abweicht. 

Es lag also eine korpusvergleichende Studie? nahe, in der wir das Vorkom- 
men und den Gebrauch von Kausal- und metakommunikativen Konnektoren (im 
Sinne von Breindl, Volodina & Waßner 2014) in unterschiedlichen monologi- 
schen und dialogischen Text-/Kommunikationsformen analysieren. Einerseits 
können wir so ältere Forschungsfragen anhand neuer Datensätze bearbeiten, an- 
dererseits können wir gegebenenfalls auch neue Forschungsfragen aufwerfen, 
die sich am neuen Material ergeben. 

Eine solche neue Forschungsfrage ist bspw. das Phänomen der multimoda- 
len Kohärenz. Hierbei wird ein Text mit einem nicht sprachlich realisierten Kon- 
nekt (i.S.v. Pasch et al. 2003: 401) verknüpft, bspw. einem Bild, einem Video oder 


5 Eine Fallstudie wird auch von Aivars Glaznieks auf unserem Projektblog vorgestellt: 
https://mitqualitaet.com/2019/06/19/konnektorengebrauch-online-eine-fallstudie [letzter Zu- 
griff am 20.12.2022] 
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einem Link, der wiederum sowohl mit Bild- als auch mit Videomaterial kombi- 
niert werden kann. Ein typisches Beispiel entstammt einem Facebook-Post, des- 
sen Textteil aus „weil ich die Petition gelesen habe“ besteht. Dies ist keine Ant- 
wort in einem Thread (bspw. auf die Frage „Warum hast Du das geteilt?“) oder 
Ähnliches, sondern wird erst dadurch verständlich, dass mit dem Post auch ein 
Link geteilt wird, der auf eine Petition verweist. Dieser Link stellt das externe 
Konnekt dar, auf das sich der weil-Satz bezieht (vgl. Abel & Glaznieks 2020a). 

Zwar werden Konnektoren in den von uns untersuchten Korpora tatsächlich 
wie eben beschrieben eingesetzt, es fällt aber doch auf, dass Verwendungen, die 
vom traditionellen Schriftstandard abweichen, deutlich in der Minderheit sind. 
Im Kontext dieses Projektbereichs bietet es sich auch an, die Verwendung von 
weil in einer Nebensatzkonstruktion mit Verbzweitsatz (V2) zu untersuchen. Im 
geschriebenen Standard gilt diese Variante als nicht akzeptabel, während sie in 
gesprochener Sprache durchaus verwendet wird und als korrekt gilt.‘ 

In einer Pilotstudie haben wir Facebook-Texte (Pinnwandeinträge, Kommen- 
tare und Chat-Nachrichten) aus dem DiDi-Korpus, Wikipedia-Artikeldiskussio- 
nen und Wikipedia-Nutzerdiskussionen, Erörterungsaufsätze aus Oberschulen 
und Zeitungskommentare aus dem Deutschen Referenzkorpus DeReKo als Text- 
srundlagen herangezogen. In den untersuchten Facebook-Texten folgten 26,2 % 
der mit weil gebildeten Sätze dem V2-Schema, während die Mehrheit der Sätze 
(67,8%) dem klassischen Nebensatzschema mit Verbendstellung folgt. Auf den 
untersuchten Diskussionsseiten der Wikipedia ist der Anteil der Verbzweitsätze 
noch weitaus geringer (3,1%). Mit über 90 % kommen hier die Nebensatzkon- 
struktionen häufiger vor. Wie erwartet dominieren in den am Schriftstandard ori- 
entierten Texten die Formen mit Verbletztstellung: in den Schüleraufsätzen mit 
96,2 % und in den Zeitungskommentaren mit 97,9 %. 

Eine dritte Variante des Einsatzes von weil haben wir ebenfalls untersucht, 
nämlich das oben bereits angesprochene Phänomen des syntaktisch selbststän- 
dig vorkommenden weil-Satzes. In den untersuchten Facebook-Texten entfallen 
ungefähr 13 % aller Sätze mit weil auf diese Konstruktion. Weder in den Wikipe- 
dia-Diskussionen noch in den schriftstandard-nahen Texten finden sich diese in 
nennenswerter Anzahl. Einerseits werden diese selbstständigen weil-Sätze als 
Antworten auf bereits gestellte Warum-Fragen eingesetzt, insbesondere in Chats 
und Kommentaren. Prinzipiell wäre dies zwar auch in Wikipedia-Diskussionen 
denkbar, wir konnten es aber in weitaus geringerem Ausmaß (< 3 %) beobachten 
als in den Facebook-Texten. Die andere Funktion haben wir oben bereits kurz 


6 So beispielsweise in der Internetpräsenz des Dudens nachzulesen [letzter Zugriff am 20. De- 
zember 2022]: https://www.duden.de/sprachwissen/sprachratgeber/Satzbau-nach-weil 
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skizziert: Es handelt sich um hypermodale Texte, die geschriebenen Text, Bild- 
oder Videomaterial sowie Hyperlinks vereinen. Der selbstständige weil-Satz 
(Pasch et al. 2003: 401, sprechen hier von „situativ-elliptischen“ Sätzen, eine 
zweite Klasse von syntaktisch selbstständigen Sätze bezeichnen sie als „sprach- 
lich gestützt“, bspw. jene nach Sprechwechsel) kann in diesem Kontext dann 
meist als Begründung für das Posten des nicht-textlichen Materials verstanden 
werden. 

Wenn wir die Ergebnisse der Pilotstudie mit einer der Ausgangsfragen des 
Projekts rückkoppeln, müssen wir zunächst konstatieren, dass die in Facebook- 
Texten nachweisbaren nicht-normgerechten Verwendungsweisen — wenn über- 
haupt - nur sehr selten in Texte „durchsickern“, die sich an den Normen der stan- 
dardsprachlichen Schriftproduktion orientieren. Selbst in interaktionsorientier- 
ten Online-Texten, wie sie im Facebook-Korpus repräsentiert sind, befinden sich 
die nicht-standardorientierten Verwendungen in der Minderheit. Daraus folgern 
wir zum jetzigen Zeitpunkt, dass interaktionsorientiertes und textorientiertes 
Schreiben und die damit verbundenen Stilebenen, die auch über die entspre- 
chende Verwendung von weil mit Haupt- bzw. Nebensatz ausgedrückt werden 
können, von den Schreiberinnen und Schreibern der von uns untersuchten Texte 
auseinandergehalten werden können. Die eindeutige Präferenz für weil-Neben- 
sätze mit Verbletztstellung in Schülertexten und Zeitungskommentaren spricht 
dafür, dass sich die Schreiberinnen und Schreiber durchaus bewusst sind, dass 
in diesen Texten eine Standardvarietät verwendet werden muss bzw. sollte - und 
diese lässt im Geschriebenen eben noch keine weil-Hauptsatzkonstruktion zu. 

Detailliertere Ausführungen zu den korpusgestützten Analysen werden in 
Abel & Glaznieks (2020a, 2020b) präsentiert. Unter einer methodischen Perspek- 
tive können wir aber anhand der Pilotstudien bereits schließen, dass insbeson- 
dere korpusvergleichende Studien in einem variationslinguistischen Paradigma 
dazu geeignet sind, die in Abschnitt 2 angesprochene Brücke in wenig kartiertes 
linguistisches Terrain zu schlagen. Ähnlich argumentiert Meiler (2021: 89), der 
im medienlinguistischen Kontext dafür plädiert „vergleichbare kommunikative 
Formen und Funktionen in die kontrastive Analyse“, dort in Bezug auf das wis- 
senschaftliche Twittern, einzubeziehen. Als Kontrastdimensionen für den von 
ihm gewählten Gegenstand schlägt er außerdem verschiedene konstellative Be- 
dingungen sowie unterschiedliche mediale Bedingungen vor. In den von uns ver- 
wendeten Korpora stehen zwar verschiedene konstellative Bedingungen zur Ver- 
fügung, diese haben wir aber noch nicht kontrastiv analysiert. Im Vorgriff auf 
den nächsten Abschnitt hatten wir tatsächlich während der Studienkonzeption 
darüber nachgedacht, verschiedene Konstellationen von (angeblich) Kommuni- 
zierenden und Versuchsteilnehmenden (bspw. alt vs. jung, verschiedene Hierar- 
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chieebenen usw.) systematisch zu variieren. Wir haben uns für die hier beschrie- 
bene Studie allerdings dagegen entschieden, da jede weitere Variation zu einer 
Expansion des Experimentaldesigns geführt hätte, die wiederum zur Folge ge- 
habt hätte, dass deutlich mehr Befragte nötig gewesen wären. 

Wir flankieren nun also den oben beschriebenen korpuslinguistischen Zu- 
gang mit Befragungen von Mitgliedern der Sprachgemeinschaft, um ein ausführ- 
licheres Bild des ausgewählten sprachlichen Phänomens zu erhalten. Auch dort 
konzentrieren wir uns auf verschiedene Realisierungen von Nebensätzen mit 
weil. Ansätze, in denen mehrere methodische Zugänge (bspw. hier Korpusstudi- 
en und Akzeptabilitätsbefragungen) kombiniert werden, werden gemeinhin als 
»Konvergierende Evidenz“ bezeichnet (s. hierzu auch den von Schönefeld 2011 
herausgegebenen Band). Die zugrundeliegende Motivation ist, dass ein sprachli- 
ches Phänomen umfassender beschrieben werden kann, wenn es methodisch 
aus unterschiedlichen Richtungen angegangen wird. Schwächen der einen Me- 
thode werden - so die Hoffnung - durch Stärken der anderen ausgeglichen. Auch 
wird das Bild als Ganzes vielfältiger, weil verschiedene Methoden immer unter- 
schiedliche Aspekte eines sprachlichen Phänomens beleuchten. Flick (2011: 12) 
beschreibt dies als „Triangulation“ und definiert diese als die „Einnahme unter- 
schiedlicher Perspektiven auf einen untersuchten Gegenstand [...]. Diese Per- 
spektiven können sich in unterschiedlichen Methoden, die angewandt werden, 
und/oder unterschiedlichen theoretischen Zugängen konkretisieren [...]. Weiter- 
hin bezieht sie sich auf die Kombination unterschiedlicher Datensorten [...]. Diese 
Perspektiven sollten so weit als möglich gleichberechtigt und gleichermaßen 
konsequent behandelt und umgesetzt werden.“ Die korpuslinguistische Metho- 
dik haben wir eben vorgestellt, die Erhebung von Urteilen der Sprachgemein- 
schaft nutzt die sozialwissenschaftliche Methode der Befragung in einem experi- 
mentell-psycholinguistischen Versuchsaufbau. Dementsprechend ändert sich 
auch die Datensorte bzw. der Datentyp: Primärdatum der korpuslinguistischen 
Untersuchung ist das Sprachmaterial selbst und daraus abgeleitet werden (rela- 
tive) Häufigkeiten. Das gilt auch für die im Folgenden vorzustellende Erhebung 
innerhalb der Sprachgemeinschaft. Analysiert werden aber nicht diese Primärda- 
ten, sondern die Einschätzungen, Vervollständigungen und Assoziationen, die 
die Teilnehmenden geben. 


4 Sprachgemeinschaft 


Dass zwischen der Richtigkeit und Angemessenheit sprachlicher Äußerungen 
unterschieden werden kann, ist zunächst eine Behauptung. Zwar haben wir selbst 
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in Kapitel 2 diese Behauptung aufgestellt, doch wir können sie durch die korpus- 
linguistischen und akzeptabilitätsbasierten Studien auch gezielt überprüfen. Die 
Befragung der Sprachgemeinschaft selbst ist insofern interessant, da wir uns 
nicht sicher sein können, inwiefern diese sprachwissenschaftliche Unterschei- 
dung auch innerhalb weiter Teile der Gemeinschaft der Sprecherinnen und Spre- 
cher des Deutschen psychologische Relevanz besitzt. Anders formuliert: Würden 
Sprecherinnen und Sprecher diese Unterscheidung nicht machen oder danach 
handeln — welche Relevanz hätte sie dann noch im sprachwissenschaftlichen 
Diskurs? Für das von uns untersuchte Phänomen spricht auch Freywald (2010: 
58) vom „beinahe schon klassisch zu nennende[n] Fall für das Auseinanderklaf- 
fen von bewusster Wahrnehmung und tatsächlicher Emergenz einer Struktur“. 

Wir können an dieser Stelle nicht auf alle Einzelheiten des Studiendesigns 
eingehen und verweisen auf Wolfer, Müller-Spitzer & Ribeiro Silveira (2020) bzw. 
die diversen Blogeinträge,’ die wir zu den Studien verfasst haben. An dieser Stelle 
sollen die für diesen Beitrag relevanten Ergebnisse lediglich knapp zusammen- 
gefasst und mit den anderen Arbeitsbereichen des Projekts in Beziehung gesetzt 
werden. Wir fokussieren hier außerdem auf methodologische Überlegungen zum 
Experimentaldesign. 

Eine Pilotstudie haben wir im Pen-and-Paper-Format auf den Straßen Mann- 
heims und Heidelbergs durchgeführt, um den Entwurf des Studiendesigns zu tes- 
ten. Wir präsentierten vier Satzversionen eines mit weil eingeleiteten Nebensat- 
zes (V-letzt, V2, schwache elliptische Version, starke elliptische Version)? in drei 
Kontexten. Wir konnten auf diese Weise sichergehen, dass die Befragten mit der 
Aufgabenstellung und insbesondere der Frage, „Fänden Sie die folgenden Sätze 
in Ordnung, wenn Sie sie in [Medium] lesen würden (abgesehen vom Inhalt)?“ 
zurechtkamen, wobei [Medium] mit „einer überregionalen Tageszeitung“ oder 
mit „einer Textnachricht von einem Freund“ gefüllt war. Eine dritte Fragenvari- 
ante führte die Sätze kontextfrei ein: „Finden Sie die Sätze in Ordnung (abge- 


7 Diese Beiträge sind unter den folgenden URLs einsehbar: 
(1) https://mitqualitaet.com/2019/06/25/weil-ausbildung-eine-studie-zur-einschatzung- 
der-angemessenheit-von-texten-in-whatsapp-und-printmedien, 
(2) https://mitqualitaet.com/2019/07/24/sie-hat-gute-chancen-auf-den-job-weil- 
ergebnisse-einer-aufgabe-zur-satzvervollstandigung-in-whatsapp-und-printmedien, 
(3) https://mitqualitaet.com/2019/08/20/woher-stammt-dieser-satz-die-ergebnisse-der- 
assoziationsaufgabe/ [alle zuletzt abgerufen am 20.12.2022]. 
8 Die V-letzt-Version lautete bspw. „Sie gehen ins Freibad, weil schönes Wetter ist“. Entspre- 
chend lautete die V2-Version „Sie gehen ins Freibad, weil es ist schönes Wetter.“ In der schwach 
elliptischen Version ließen wir das Verb weg (,„[...], weil schönes Wetter.“) und in der stark ellip- 
tischen Version zusätzlich das Adjektiv (,,[...] weil Wetter.“). 
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sehen vom Inhalt)?“ Wir verzichteten in der kontextfreien Variante auf den Kon- 
junktiv II („Fänden Sie ...“), da uns diese Form in der kontextfreien Variante deut- 
lich unnatürlicher erschien. Da es sich um eine Pilotstudie handelte, ist diese Ab- 
weichung in den Fragetexten zu verkraften. In der Hauptstudie strichen wir die 
kontextfreie Präsentation, da die Ergebnisse sehr nahe an der Zeitungsvariante 
waren. In den verbliebenen Fragen verwendeten wir nur den Indikativ. Außer- 
dem strichen wir für die Hauptstudie die schwache elliptische Version, da nur 
marginale Unterschiede in den Bewertungen zur starken elliptischen Version 
festzustellen waren. Ferner ergab sich, dass insbesondere die Präsentation von 
Text, der aus einer Textnachricht stammen soll, auf Papier unnatürlich auf die 
Befragten wirkte (wie sie häufiger mündlich äußerten). Wir beschreiben unten, 
wie wir versuchten, dies zu umgehen. Es deutete sich außerdem bereits in der 
Pilotstudie an, dass die befragten Personen ein ausgeprägtes Normbewusstsein 
an den Tag legten: Unabhängig vom Kontext lagen die Bewertungen der Versio- 
nen, die nicht dem Schriftstandard entsprechen, konsequent unter jenen für die 
V-letzt-Version. Das ist insofern nicht sehr überraschend, da wir mit der Pilotstu- 
die Einblicke das Sprachbewusstsein der Befragten erhalten wollten. Behrens 
(2015) stellt dazu fest, dass Sprachbewusstsein „doppelgesichtig“ sei: „Einerseits 
beschreibt es quasi wertneutral das Wissen und die Reflexion über Sprache“ und 
führe so zu „differenzierten Urteilen über Sprache und idealerweise auch zu ei- 
nem differenzierten und angemessenen Sprachgebrauch“ (Behrens 2015: 2). 
Diese Art des Sprachbewusstseins wollten wir mit der Pilotstudie, in der Befragte 
möglichst spontan in einer alltäglichen Umgebung antworten sollten, erheben. 
Allerdings, so Behrens (2015) weiter, sei Sprachbewusstsein oft „vermengt mit 
der normativ ausgerichteten Sprachpflege und Sprachkritik“ — ein Aspekt, den 
wir mit der Formulierung der Frage („in Ordnung finden“) durchaus mitaktiviert 
zu haben scheinen. Ferner kann hier — Neuland (2016) folgend - in die Konzepte 
Sprachbewusstsein, Sprachgefühl und Spracheinstellung unterschieden wer- 
den. Spracheinstellungen werden dabei angesehen „als eine Größe, die zwischen 
einem subjektiven Sprachgefühl und einem klaren und begründbaren Sprachbe- 
wusstsein anzusiedeln ist“ (Neuland 2016: 41). Die in unseren Studien elizitierten 
Einschätzungen zielen auf genau diese Zwischenebene ab, die sowohl implizite 
als auch potentiell bewusstseinsfähige Anteile besitzt. 

Die Hauptstudie wurde mit einem Online-Fragebogen durchgeführt. Dies gab 
uns die Gelegenheit, die Kontexte nicht nur sprachlich, sondern auch visuell 
deutlicher zu markieren und eine diversere Stichprobe zu akquirieren. Wir er- 
stellten sprachliche Stimuli, die visuell dem jeweiligen Kontext angepasst waren. 
Textnachrichten präsentierten wir in Form eines Screenshots einer WhatsApp- 
Nachricht, Zeitungstexte im Layout einer Zeitung. Kurze Textteile vor dem eigent- 
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lichen Stimulussatz sorgten für einen passenden Kontext innerhalb des jeweili- 
gen Mediums. Weitere Textteile wurden unscharf dargestellt. Abbildung 1 zeigt 
das Layout der simulierten Medien. 


Viele 
Eltern versuchen, sich und ihren 
Kindern in den Sommermonaten 
Abkühlung zu verschaffen. Sie 
Ich schon. Peter und Lisa nicht. gehen ins Freibad, weil schönes 
Wetter ist. 


Kommt ihr mit ins Kino? 


Sie gehen Ins Freibad, weil 
schönes Wetter ist. 


Abbildung 1: Beispiel einer simulierten WhatsApp-Textnachricht (links) und einer simulierten 
gedruckten Zeitung (rechts) aus der Bewertungsaufgabe 


In der Hauptstudie haben wir mehrere Aufgaben gestellt, die von unterschiedli- 
chen Personen bearbeitet wurden. Einerseits haben wir — wie in der Vorstudie — 
Sätze bewerten lassen. Ein Stimuluspaar ist in Abbildung 1 zu sehen. Während 
wir in der Vorstudie eine 5-stufige Likert-Skala zur Bewertung einsetzten, kamen 
in der Hauptstudie über einen Schieberegler realisierte Einschätzungen zwischen 
O und 100 zum Einsatz. Dies hat erstens den Vorteil, dass die Befragten eine fein- 
stufigere Einschätzung abgeben können. Zweitens ist mit Likert-Skalen grund- 
sätzlich das Problem assoziiert, dass es sich dabei um eine Ordinalskala handelt, 
was die Menge potentieller statistischer Auswertungen deutlich reduziert. Eine 
stufenlose Bewertung zwischen 0 und 100 hingegen kann mit Methoden ausge- 
wertet werden, die eine echte Intervallskala voraussetzen. 

Eine zweite Aufgabe bestand darin, Nebensätze zu produzieren. Hier gaben 
wir lediglich den ersten Satzteil und die Fortsetzung mit weil vor, und die Befrag- 
ten mussten den Nebensatz vervollständigen. Die Stimuli sahen aus wie in Abbil- 
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dung 1 dargestellt. Der einzige Unterschied für die Produktionsaufgabe war, dass 
Auslassungspunkte nach „Sie gehen ins Freibad, weil“ folgten. Die Produktions- 
aufgabe nahmen wir in die Hauptstudie auf, weil die ursprüngliche Bewertungs- 
aufgabe zwar den Kern unserer Fragestellung ausmacht, aber das bloße Vorhan- 
densein von bestimmten Konstruktionen durch deren Darstellung ein Stück weit 
„unterstellt“. Anders formuliert: Wenn es auf dem Bildschirm dargestellt ist, legt 
das nahe, dass es solche Konstruktionen in den entsprechenden Medien tatsäch- 
lich gibt. Allein das könnte schon einen Effekt auf die Bewertungen der Teilneh- 
menden haben. Der Kontrast zwischen Bewertungs- und Produktionsaufgabe 
greift so den von Neuland (2016: 40) formulierten Hinweis auf, dass „zwischen 
dem Sprachbewusstsein und dem tatsächlichen Sprachgebrauch in empirischen 
Erhebungen sorgfältig unterschieden“ werden müsse. 

In der dritten Aufgabe sollten die Befragten Sätze mit bestimmten Medien 
und Textsorten assoziieren. Diese Stimuli wurden nicht als simulierte Medien 
präsentiert, sondern ohne visuellen Kontext. Die Sätze selbst waren über alle Auf- 
gaben hinweg dieselben, um später die Aufgaben miteinander vergleichen zu 
können. Diese Aufgabe nahmen wir hauptsächlich deshalb auf, um eine weitere 
Art von Antwortformat verfügbar zu haben, die wir mit den anderen Formaten ver- 
gleichen können. Zudem zeigte die Studie von Koplenig, Knöbl & Deppermann 
(2016), dass linguistische Laien und Laiinnen sprachliches Stimulusmaterial zu 
bestimmten Sprachsituationen zuordnen können und eine solche Methode ge- 
winnbringend in einem variationslinguistischen Studienaufbau eingesetzt wer- 
den kann. 

Die gemeinsame Betrachtung aller Aufgaben zeigte im Zusammenspiel mit 
den im vorherigen Abschnitt genannten Ergebnissen ein stimmiges Bild. Unmit- 
telbar auffällig ist, dass die dem Schriftstandard entsprechende Version am häu- 
figsten produziert wurde und in allen Kontexten als am akzeptabelsten einge- 
schätzt wurde. Assoziiert wurden diese Sätze am ehesten mit Zeitungen, Briefen/ 
Postkarten,’ aber auch mit E-Mails. Dies legt ein starkes Normbewusstsein der 
Befragten nahe - wie auch die in Abschnitt 3 referierten Verteilungen über die 


9 Unsist bewusst, dass insbesondere bei Briefen/Postkarten, aber auch bei einigen anderen Me- 
dien/Textsorten das Spektrum potentieller Ausrichtungen am Schriftstandard sehr groß sein 
kann: Eine Urlaubspostkarte an Freunde wird im Allgemeinen weniger nah am Schriftstandard 
ausgerichtet sein als ein Brief an einen Geschäftskunden im professionellen Kontext. In der As- 
soziationsaufgabe war es uns aber insbesondere wichtig, Kontraste zu anderen Textsorten/Me- 
dien herauszuarbeiten und nicht durch weitere Binnendifferenzierungen die Aufgabe mit zu- 
sätzlicher Komplexität im Antwortformat zu versehen. Unsere Ergebnisse sind somit am ehesten 
so zu lesen, dass es um den prototypischen Brief/die prototypische Postkarte geht, die die Be- 
fragten beim Ausfüllen des Fragebogens vor Augen hatten. 
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verschiedenen Korpustypen hinweg. Dies legt die Frage nahe, inwieweit die Be- 
fragten tatsächlich zwischen Richtigkeit und Angemessenheit unterscheiden, 
wenn sie doch durch die Bank - also ohne die Beachtung des medialen Kontextes 
— die Schriftstandard-Variante als akzeptabler einschätzen. Tatsächlich muss 
man in den Daten etwas tiefer graben, um auf einen entsprechenden Effekt zu 
stoßen. Interessanterweise unterscheiden die Befragten nämlich doch zwischen 
dem Zeitungskontext und dem Kontext der Textnachricht. In der Bewertungsauf- 
gabe drückt sich das dadurch aus, dass der Unterschied zwischen Schriftstan- 
dardvariante (V-letzt) und Nicht-Schriftstandardvarianten (V2 und Ellipse) in 
Textnachrichten kleiner ist. Statistisch schlägt sich das in einem signifikanten 
Interaktionseffekt nieder. Die Befragten differenzierten bei ihren Bewertungen 
also durchaus zwischen Zeitungs- und Textnachrichtskontext. 

Ähnliches deutet sich in der Produktionsaufgabe an. Hier wurden zwar insge- 
samt fast nur V-letzt-Varianten produziert, aber die wenigen abweichenden Schrei- 
bungen, die vorkamen (25 insgesamt), wurden fast ausschließlich (23 Stück) im 
Kontext der WhatsApp-Textnachricht produziert. Auch hier gilt also: Generell do- 
miniert eine starke Orientierung an der schriftsprachlichen Norm, doch „darun- 
ter“ liegt ein Effekt, der eine Differenzierung von Akzeptabilität in Abhängigkeit 
vom Äußerungsmedium zeigt. 


Zeitung 
Brief/Postkarte 


E-Mail $ 
Version 


V-Letzt 
Soziale Netzwerke 
v2 


8 E's- 


Textnachricht 
Sprachnachricht 


Anderes 
Anzahl 


Abbildung 2: Absolute Häufigkeiten der Assoziationen zu verschiedenen Medien/Textsorten 
aus der Assoziationsaufgabe 


Die Ergebnisse der Assoziationsaufgabe zeigen ebenfalls, dass die Befragten deutlich 
differenzieren konnten (s. Abbildung 2). Hier boten wir auch die Option Sprachnach- 
richt (meist kurze Aufnahmen, die per WhatsApp verschickt werden) zur Assozi- 
ation an. Die durch weil eingeleiteten Nebensätze mit V2-Stellung wurden beson- 
ders stark dem Medium Sprachnachricht zugeordnet. Elliptische Strukturen hin- 
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gegen wurden deutlich mit Textnachrichten und teilweise mit sozialen Netzwer- 
ken assoziiert. 


5 Fazit 


Anhand eines kleinen Ausschnitts aus dem Phänomenbereich Kohärenz, näm- 
lich der unterschiedlichen Verwendung des Kausalkonnektors weil, haben wir ge- 
zeigt, wie man aus methodisch unterschiedlichen Richtungen auf ein Phänomen 
Zugriff bekommen kann. Die Korpusvergleichsstudie zeigt, dass auch in den un- 
tersuchten Facebook-Texten die schriftsprachliche Norm dominiert, gleichzeitig 
aber nur dort nicht-schriftsprachliche Varianten nachgewiesen werden können 
(zumindest in nennenswerter Anzahl). Dies deckt sich mit den Ergebnissen aus 
den Befragungen insofern, dass auch dort die Schriftstandardvariante von den 
meisten als am angemessensten bewertet und am häufigsten produziert wurde. 
Zu diesem Effekt tritt allerdings ein zweiter, schwächerer Effekt hinzu: In Text- 
nachrichten wird der Unterschied in der Akzeptabilität zwischen Standard- und 
Nichtstandardvarianten etwas kleiner eingeschätzt (was in statistischer Termino- 
logie als Interaktionseffekt bezeichnet wird). Auch werden — wenn sie überhaupt 
produziert werden - Nichtstandardvarianten fast ausschließlich in Textnachrich- 
ten produziert. Im Rückbezug auf das Modell heißt das, dass das Konzept der An- 
gemessenheit (im Kontrast zu Richtigkeit) offenbar in der Sprachgemeinschaft 
psychologisch relevant ist. Bei aller Orientierung an der Richtigkeit der sprachli- 
chen Form scheinen sich die Befragten bewusst zu sein, dass in unterschiedli- 
chen Textsorten und Medien auch unterschiedlich geschrieben wird bzw. ge- 
schrieben werden kann. Der Teilbereich „Mediale Passung“, der einen der neuen 
Punkte am Textqualitätsmodell ausmacht, hat also sowohl hinsichtlich der psy- 
chologischen Realität in der Sprachgemeinschaft als auch hinsichtlich der aus- 
gewerteten Korpusbelege seine Berechtigung. 

In Bezug auf das Konzept der Triangulation, wie es in Flick (2011) ausgeführt 
wird, wäre zukünftig ein noch stärkerer Bezug dieser beiden methodologischen 
Ansätze wünschenswert. Zwar untersuchten wir das gleiche sprachliche Phäno- 
men, der Bezug der Ergebnisse ist uns aber nur auf einer recht abstrakten Ebene 
möglich. Wir können zwar die „Rangordnung“ von verschiedenen Varianten hin- 
sichtlich ihrer Frequenz in Korpora und der Bewertung und Produktion in der Be- 
fragung vergleichen und können dort ähnliche Ergebnismuster zeigen. Es wäre 
aber in einem weiteren Schritt auch sinnvoll, das primäre Sprachmaterial über 
die verschiedenen Methoden hinweg konstant zu halten, um einen stärker am 
konkreten sprachlichen Material ausgerichteten Vergleich zu ermöglichen. Dies 
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ist allerdings nicht ganz trivial, was u.a. an den Anforderungen liegt, die das ex- 
perimentelle Paradigma generell an Stimulusmaterial (und zwar nicht nur sprach- 
liches) stellt. Die Grundidee ist hier, dass durch minimale Variation des Stimulus, 
bspw. die Einbettung eines Satzes in unterschiedliche Medien oder die Variation 
der Nebensatzrealisierung, unter Konstanthaltung möglichst aller sonstigen Ein- 
flüsse, bspw. der kontextuellen Passung oder des semantischen Gehalts des Sat- 
zes, ein kausaler Schluss von der Variablenmanipulation auf die Effekte möglich 
wird. Dies führt dazu, dass das in experimentell ausgerichteten Studien verwen- 
dete sprachliche Material immer bis zu einem gewissen Grad artifiziell ist, denn 
selbst wenn ein authentischer (also tatsächlich in Korpora beobachteter) Satz als 
Ausgangspunkt dient, müssen die oben beschriebenen minimalen Variationen ge- 
zielt von den Forschenden „hergestellt“ werden. Im experimentellen Paradigma 
ist Sprache insofern immer zuerst einmal ein Stimulus wie jeder andere, der sich 
den Voraussetzungen des Paradigmas „beugen“ muss. In korpuslinguistischen 
Untersuchungen wird sprachliches Material zwar mit zusätzlichen Informationen 
angereichert, also annotiert, es wird aber ansonsten genauso verwendet, ausge- 
zählt und analysiert, wie es vorliegt („as is“).'° 

Es soll auch nicht unerwähnt bleiben, dass im Projekt nur ein Teilbereich der 
potentiell interessanten Implikationen aus dem Modell methodisch getestet wer- 
den konnte. Die untersuchten Kausalkonnektoren befinden sich zwar am Schnitt- 
punkt von Kohärenz und medialer Passung, dies lässt aber immer noch große 
Bereiche des Textqualitätsmodells sowohl korpuslinguistisch als auch hinsicht- 
lich der psychologischen Realität bei Sprecherinnen und Sprechern empirisch 
unerforscht. Besonders lohnenswert scheint es, die Auffassung von Texten als 
Entitäten mit stabiler Gestalt und linearer Organisation zu überdenken (vgl. hier- 
zu auch Storrer 2020). Wenn man Texte als „multimodal ensemble[s]“ (Bucher 
2017: 92) auffasst, die „more than the sum of its parts“ sind, muss man sich 
gleichzeitig fragen: „How do recipients integrate the different modes and acquire 
a coherent understanding of the multimodal discourse?“ (Bucher 2017: 91). Aus- 
gehend von dieser Leitfrage ließen sich viele Fragestellungen generieren, die wir 
bisher nicht verfolgt haben. An dem oben gezeigten Ausschnitt haben wir aber 
versucht zu zeigen, dass es sich lohnt, die theoretischen Modellaussagen einer- 
seits anhand verschiedener methodischer Zugänge zu evaluieren, andererseits 


10 Man könnte argumentieren, dass sprachliches Material in gesprochensprachlichen Korpora 
weniger authentisch ist als in schriftsprachlichen Korpora, da hier oft eine normierte Variante 
repräsentiert wird. Diese - von bspw. Kontraktionen oder dialektalen Variationen bereinigte — 
Datenschicht kann (und sollte) aber als Annotationsebene konzeptualisiert werden. Solange das 
ursprüngliche Sprachsignal zugreifbar bleibt, ist diese Argumentation also hinfällig. 
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tiefergehender zu spezifizieren. In einem wechselseitigen Zusammenspiel zwi- 
schen Theorie und Empirie können so weitere Bereiche des Modells mit zusätzli- 
chen Erkenntnissen abgesichert und angereichert werden. So hoffen wir, einerin 
Korpustexten und der Sprachgemeinschaft empirisch fundierten Einschätzung 
der Qualität von digitalen Texten in den Sozialen Medien Stück für Stück näher- 
zukommen. Anders formuliert: Die Fragen, die wir an einen Text stellen, um ihn 
in einem zweiten Schritt zu bewerten, werden durch die empirischen Ergebnisse 
motiviert und geschärft. 
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Teil Ill: Methodologische Reflexion 
interdisziplinärer Analysekategorien 


Eilika Fobbe 
Linguistik und psychologische 
Täuschungsforschung 


Zum Problem der verbalen Lügenindikatoren 
am Beispiel der Selbst-Referenz 


Abstract: Verbale Lügenindikatoren haben in der sozialpsychologischen Täu- 
schungsforschung eine lange Tradition. Ihre Analyse erfolgt größtenteils ohne 
Rückgriff auf linguistische Forschungsergebnisse. Die am Beispiel des Merkmals 
Selbst-Referenz durchgeführte Gegenüberstellung linguistischer und psychologi- 
scher Herangehensweisen zeigt, dass der Mangel an Interdisziplinarität metho- 
dologische Fragen aufwirft, die es für die angewandte Linguistik erschweren, psy- 
chologische Forschungsergebnisse zu verbalen Lügenindikatoren für die eigene 
Forschung zu nutzen. Zugleich stehen psychologische Aussagen zum Sprachge- 
brauch unter den Bedingungen des Lügens auf dem Prüfstand. 


Keywords: Psychologie, Lügenmerkmale, Selbst-Referenz, Pragmatik, 
forensische Linguistik 


1 Einleitung 


Zahlreiche Studien der Sozialpsychologie widmen sich der Frage, ob sich am Ver- 
halten, der Sprechweise und der Sprache einer Person erkennen lässt, ob diese 
lügt oder die Wahrheit sagt. Der Katalog der Merkmale, die potentiell Lügen an- 
zeigen, ist ebenso umfangreich wie die Studien zu ihrem möglichen Indikator- 
wert und war bereits mehrfach Gegenstand von Meta-Analysen.' Im Fokus dieser 


1 Eine der bekanntesten Meta-Studien ist die von DePaulo et al. (2003), die auf 158 cues (Indi- 
katoren) kommt, eine aktuelle ist die von Hauch (2016), die 79 Indikatoren untersucht. 
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Untersuchungen stehen überwiegend die nonverbalen (z.B. Mimik, Gestik, Kör- 
perhaltung) und die paraverbalen Merkmale (z.B. Stimmhöhe, Redegeschwindig- 
keit, Latenzzeiten oder Häsitationen). Verbale Merkmale im eigentlichen Sinne 
werden meist mit nonverbalen kombiniert untersucht. Zu diesen verbalen Merk- 
malen zählen üblicherweise inhaltliche Indikatoren (z.B. der Detailreichtum ei- 
ner Darstellung) oder stilistische Merkmale, die auf den Gesamteindruck der Äu- 
Berung verweisen (z.B. Vagheit, ausweichender Stil). Linguistisch betrachtet han- 
delt es sich bei diesem Typ von Lügenindikatoren um Formen der Sprachverwen- 
dung, die auch Gegenstand stilistischer bzw. pragmatischer Analysen sind, und 
bei deren Beschreibung Linguistik (und Sprachphilosophie) in ihrer wissen- 
schaftlichen Beschäftigung mit Lüge und sprachlicher Täuschung auf eine lange 
Tradition zurückblicken.’ Aber auch oberflächensyntaktische Merkmale, wie be- 
stimmte semantisch definierte Lexemklassen oder Wortarten (z.B. negative Wör- 
ter, Pronomen), gelten Teilen der psychologischen Täuschungsforschung als aus- 
sagekräftige Liigenmerkmale.’ Einen besonders populären, wenngleich nicht un- 
problematischen Ansatz vertritt die Forschergruppe um James W. Pennebaker, 
dessen Textanalyseprogramm LIWC von vielen nachfolgenden Studien übernom- 
men wurde.“ Um diese im engen Sinne verbalen Lügenmerkmale soll es in den 
folgenden Ausführungen gehen. Aus linguistischer Sicht sind sie aus verschiede- 
nen Gründen interessant. Zum einen stellt sich die Frage, um welche Wörter oder 
Wortgruppen es sich dabei konkret handelt und wie ihr Indikatorwert begründet 
wird. Diesen sprachlichen (Lügen-)Merkmalen fehlt es bislang an einer linguisti- 
schen Fundierung, die ggf. auch den Indikatorwert der betreffenden Merkmale 
linguistisch stützen würde. Zum anderen gilt Ähnliches für das Postulat von einer 


2 Zum aktuellen Forschungsstand siehe auch den Sammelband von Meibauer (2019). 

3 Die psychologische Forschung in diesem Bereich hat zwei Ausrichtungen, zum einen gibt es 
die Studien zur inhaltsorientierten Aussageanalyse (international Criteria Based Content Analy- 
sis genannt) in der Tradition Udo Undeutschs, die sich der Untersuchung und Validierung von 
Glaubwürdigkeitsmerkmalen widmet, und zum anderen die Täuschungsforschung im engeren 
Sinne. Nur die Täuschungsforschung geht davon aus, dass es Ligenmerkmale im eigentlichen 
Sinne gibt. Die Forschung zur CBCA nimmt hingegen an, dass Aussagen, deren Inhalt selbst er- 
lebt wurde, im Allgemeinen sog. Glaubhaftigkeitsmerkmale aufweisen. Aus ihrer Abwesenheit 
kann nicht geschlossen werden, dass die Person nicht die Wahrheit sagt, sondern nur, dass die 
Aussage nicht erlebnisbasiert ist. Auf diesem Umstand gründet dann die Annahme, dass die Per- 
son möglicherweise lügt. Täuschungsforschung und CBCA-basierte Forschung verfolgen also 
sehr unterschiedliche Zugänge. Gegenstand linguistischer Forschung ist die CBCA bislang 
kaum, siehe aber Nicklaus & Stein (2020). 

4 LIWC enthält ein hinterlegtes Wörterbuch, dessen Lemmata nach linguistischen und psycho- 
logischen Kategorien geordnet sind. Personalpronomina gehören den sog. basislinguistischen 
Kategorien an (vgl. Wolf et al. 2008). 
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Sprache des Lügens und die diesem Postulat zugrunde liegenden Hypothesen 
über Sprache und ihren Gebrauch. Auch hier vermisst man eine Einordnung 
durch die Linguistik. Beides fordert damit zu einer kritischen (linguistischen) Be- 
trachtung des methodologischen Fundaments dieses Bereichs der Täuschungs- 
forschung auf. 

Bei allen Typen verbaler Lügenindikatoren (inhaltlichen, im weiteren Sinne 
stilistischen, wortbasierten) würde man erwarten wollen, dass linguistische For- 
schungsergebnisse zu deren Funktion und Gebrauch von der Psychologie we- 
nigstens in Teilen rezipiert und für die eigene Forschung fruchtbar gemacht wor- 
den wären, doch ist dies kaum der Fall.’ Vielmehr hat die psychologische Täu- 
schungsforschung eigene Konzepte im Umgang mit verbalen Merkmalen heraus- 
gebildet, die sich von linguistischen Herangehensweisen methodisch wie theore- 
tisch zum Teil deutlich unterscheiden (vgl. Schober 2007: 437). 

Studien zu verbalen Lügenindikatoren sind für viele gesellschaftliche Ak- 
teure aus unterschiedlichen Gründen interessant. Im Zentrum steht der Nutzen 
für die Justiz und für die Ermittlungsarbeit der Polizei (z.B. Fuller et al. 2011). Da 
bislang weder die Existenz verbaler Lügenindikatoren noch ihre Eignung zur 
Überführung von Lügnern in der Praxis eindeutig nachgewiesen werden konn- 
ten, sind sie deshalb auch in der Psychologie nach wie vor umstritten (vgl. z.B. 
Ali & Levine 2008, Burgoon et al. 1999). Auch ist die Relevanz von Ergebnissen 
der Täuschungsforschung für die polizeiliche Praxis fraglich, da sich Inhalt und 
Bedingungen experimenteller Studien von konkreten Vernehmungssituationen 
stark unterscheiden (vgl. Hermanutz & Litzcke 2012: 180-182). Zugleich gibt es in 
der angewandten Linguistik gegenläufige Bestrebungen, verbale Lügenindikato- 
ren in die forensische Textanalyse, insbesondere in die Autorschaftsbestimmung 
und die Auswertung schriftlicher (Zeugen-)Aussagen zu integrieren, in der Ab- 
sicht, so auch Antworten auf die Frage nach der Glaubwürdigkeit des Textinhalts 
geben zu können.’ Die betreffenden Merkmale werden dabei direkt aus der Psy- 
chologie übernommen. 

Obwohl die verbalen Lügenmerkmale zur Beantwortung psychologischer 
Fragestellungen dienen, arbeitet die Psychologie mit grammatischen Kategorien 
und mit Stilkonzepten. Der Umgang mit Sprache setzt eine Vorstellung von Spra- 


5 Eine Ausnahme sind z.B. Arciuli et al. (2010), die für die Untersuchung der potentiellen 
sprachlichen Lügenindikatoren ‚uhm‘ und ‚like‘ im Englischen linguistische Forschung heran- 
ziehen, die deren Funktion als Diskursmarker zum Gegenstand hat. 

6 Die generische Form Lügner (auch Sprecher und andere) wird geschlechtsneutral verwendet, 
eine geschlechtsspezifische Zuordnung ist nicht impliziert. 

7 Zum Beispiel Älmela et al. (2019), Picornell (2013), Adams & Jarvis (2006). 


208 —— Eilika Fobbe 


che, ihrer Funktion und der ihrer Elemente notwendigerweise voraus, aber die 
betreffenden Vorannahmen werden selten explizit genannt oder bestimmt (vgl. 
Schober 2007: 435). Bevor in die Diskussion um Eignung und Existenz von verba- 
len Lügenindikatoren eingetreten und für oder wider die psychologischen Ansät- 
ze argumentiert wird, soll aus diesem Grund zunächst an einem der Merkmale 
ermittelt werden, inwieweit Anknüpfungspunkte zur Linguistik bestehen und 
welche theoretischen und methodischen Fragen sich ergeben. Dies hat auch Fol- 
gen für die Anwendbarkeit dieser Merkmale innerhalb der Linguistik. 

Die folgenden Ausführungen haben daher zum Inhalt, am Beispiel der sog. 
Selbst-Referenz in einem ersten Schritt zu untersuchen, wie sich die Klassenbil- 
dung der betreffenden sprachlichen Einheiten, die zugrunde liegenden Definiti- 
onen und das Sprach- und Stilkonzept linguistisch beschreiben und verorten las- 
sen. Ziel ist es nicht, die Existenz verbaler Liigenmerkmale von vornherein in Ab- 
rede zu stellen, sondern eine erste Grundlage für eine Einschätzung zu schaffen, 
inwieweit psychologische Erkenntnisse bei einer linguistischen Beschäftigung 
mit Sprache und dem Sprachverhalten von Lügnern herangezogen werden kön- 
nen. Dafür ist aufzuzeigen, an welchen Punkten Gemeinsamkeiten zwischen Lin- 
guistik und Psychologie bestehen, wo die Rezeption linguistischer Erkenntnisse 
der psychologischen Forschung förderlich sein würde und wo aus linguistischer 
Sicht bestimmten Annahmen oder Schlussfolgerungen der psychologischen Täu- 
schungsforschung widersprochen werden muss. 


2 Das Merkmal der Selbst-Referenz 
(‚self-reference‘) 


In der Sozialpsychologie und damit auch in der sozialpsychologischen Täu- 
schungsforschung spielen das Selbst als Bezugsgröße und die Formen der Selbst- 
Referenz (vgl. Rogers et al. 1977) eine wichtige Rolle. Eine frühe Studie von Knapp 
et al. aus dem Jahr 1974, die das Kommunikationsverhalten von Lügnern unter- 
sucht, etabliert als erste eine geringere Selbst-Referenz als Indikator für Täu- 
schung. 

Laut den Verfassern wird unaufrichtiges Kommunikationsverhalten als va- 
ger, zurückhaltender, abhängiger und unangenehmer wahrgenommen. Jeder 
dieser Verhaltenseindrücke wird durch ein anderes Bündel von verbalen Merk- 
malen hervorgerufen. So würde beispielsweise der Eindruck, abhängig (von an- 
deren) zu sein, unter anderem auf weniger Selbst-Referenzen und auf mehr Frem- 
dreferenzen beruhen (vgl. Knapp et al. 1974: 21). Zur Rechtfertigung der Eignung 
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des Merkmals ‚geringere Selbst-Referenz‘ argumentieren Knapp et al., dass Lüg- 
ner dazu tendierten, sich von ihren Aussagen zu dissoziieren, und sie versuchen 
würden, sich zu distanzieren, indem sie weniger von sich selbst in Gesprächsbei- 
träge investierten als unter normalen Bedingungen (vgl. ebd.: 25). Die Ergebnisse 
der Studie bestätigten, dass die Teilnehmer, wenn sie eine Meinung vertraten, die 
nicht die ihre war, weniger Selbst-Referenzen verwendeten.® Das Merkmal der 
Selbst-Referenz hat sich seitdem als gängiges Merkmal etabliert, und im Laufe 
der Zeit ist die von Knapp et al. (1974) noch als hypothetisch formulierte Deutung 
des geringeren Vorkommens der Selbst-Referenzen von nachfolgenden Studien 
als gesicherte Erkenntnis übernommen worden. Aus dem Befund, dass Lügner 
weniger auf sich selbst referieren, wurde geschlussfolgert, dass weniger Selbst- 
Referenzen indizieren, dass die Person lügt. Es wurde allerdings nicht geprüft, ob 
das Verhältnis beider Variablen (Lügen, weniger Selbst-Referenzen) kausaler 
oder ‚nur‘ korrelativer Art ist. 

Widersprüchliche und statistisch nicht signifikante Ergebnisse nachfolgen- 
der Studien z.B. von Porter & Yuille (1996), DePaulo et al. (2003), Bond & Lee 
(2005) oder Duran et al. (2010) deuten jedoch darauf hin, dass nicht das Lügen 
die Frequenz der vorkommenden Selbst-Referenzen allein beeinflusst, sondern 
auch andere Faktoren eine Rolle spielen. Zu diesen gehören der Inhalt des Gesag- 
ten, die beteiligten Personen, die Wichtigkeit, die dem Inhalt zugeschrieben wird, 
sowie die Rolle, die der Sprecher in der Erzählung einnimmt (vgl. Hauch 2016: 
69, Hauch et al. 2015: 324-325) — kurz, Aspekte, die linguistisch als die (komple- 
xen) Faktoren von Kommunikationssituationen beschrieben werden. Als Konse- 
quenz stellten bereits Porter & Yuille die Validität von vielen Merkmalen in Frage 
und Selbst-Referenz wurde als ungeeignetes Merkmal eingestuft (vgl. Porter & 
Yuille 1996: 452, Buller et al. 1996: 281, Burgoon 2018: 624) Die Uneinheitlichkeit 


8 In dieser Studie unter Laborbedingungen wurden u.s.-amerikanische Veteranen aufgefordert, 
in einem Interview zu dem für sie wichtigen Thema der Ausbildungsförderung (nach Absolvie- 
ren des Militärdienstes) Stellung zu nehmen, einmal wahrheitsgemäß und einmal mit der Auf- 
forderung, sich dabei wie ein Student zu verhalten, der nicht die Absicht habe, zum Militär zu 
gehen. Alle Teilnehmer ‚logen‘ also einmal und sagten einmal die Wahrheit und wurden jeweils 
dabei gefilmt. Anschließend wurde pro Teilnehmer aus beiden Settings jeweils eine Minute Vi- 
deomaterial ausgewertet (vgl. Knapp et al. 1974: 18). Auch andere Studien haben das Argumen- 
tieren für eine Meinung, die man nicht vertritt, als ‚Lügen‘ definiert und aus den entsprechenden 
Versuchsanordnungen entsprechende Merkmale extrahiert, z.B. Newman et al. (2003) zu ‚Ab- 
treibung‘ oder Mihalcea & Strapparava (2009) zu ‚Todesstrafe‘. Wieder andere Versuchsanord- 
nungen in der Art von Porter & Yuille (1996) streben ein authentischeres Setting an, indem Pro- 
banden z.B. aufgefordert werden, etwas aus einem Raum/Geschäft zu stehlen, und anschließend 
befragt werden. Zu den Vor- und Nachteilen von Labor- und Feldstudien ausführlich Vrij et al. 
(2011: 91 f.) und kritisch Yuille (2013). 
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der Befunde kann in der Tat bedeuten, dass die Prämissen, auf denen die Zu- 
schreibung der Indikatorfunktion basiert, als solche so nicht gültig sind. 


2.1 Pronomina und Klassenbildung 


Als Elemente der Kategorie Selbst-Referenz gelten in der Psychologie die Prono- 
mina der 1. Person Singular aller pronominalen Subklassen, die eine solche auf- 
weisen. Es zählen dazu die Formen des Personalpronomens ich, des Reflexivums 
mir/mich und des Possessivums mein/meins.? Zusätzlich werden in vielen Studien 
auch die Personalpronomina der 2. und 3. Person erfasst, da angenommen wird, 
dass das Vorkommen aller Personalpronomina in Abhängigkeit von einander 
steht. Knapp et al. (1974: 20) argumentieren für die Analyse aller Personalprono- 
men damit, dass „several of the hypothetical assumptions [...] centered about the 
extent to which ‚people‘ became a topic of conversation in the deceptive and non- 
deceptive interviews“, und Newman et al. (2003) gehen davon aus, dass es für 
Lügner typisch sei, nicht nur weniger auf sich selbst zu verweisen, sondern zu- 
gleich vermehrt auf andere, so dass bei weniger Selbst-Referenzen zugleich mehr 
Fremdreferenzen zu erwarten wären. 

Die Wortart Pronomen als Kategorie, der die betreffenden Elemente entnom- 
men sind, definieren Campbell & Pennebaker im Zusammenhang mit der thera- 
peutischen Funktion des Erzählens wie folgt: 


Once these components [places, time, things] are introduced, their interrelationships need 
to be described. Pronoun choice communicates this relational information, even though 
pronouns are generally seen only as placeholders in language, simply referring to compo- 
nents previously introduced (Campbell & Pennebaker 2003: 64). 


Die Einschränkung even though ist aufschlussreich, da sie sich als Hinweis auf 
eine in den Augen der Verfasser unzureichende Definition lesen lässt, die die Re- 
lationen zwischen Referenten, Ort und Zeit offenbar nicht ausreichend abbildet. 
Der vermeintliche Widerspruch rührt daher, dass sich die hier angeführte traditi- 
onelle, schulgrammatische Wortartendefinition auf das syntaktische Verhalten 
bezieht und nur einen Teil der Funktion der Pronomina abdeckt, nämlich die der 
Referenz als Anaphora. Deiktika der 1. und 2. Person erfasst diese Definition nicht 
(vgl. Dirvén 1989: 377), so dass strenggenommen über ich als Pronomen, welches 
zentral für das Konzept der Selbst-Referenz ist, nichts ausgesagt werden kann. 


9 Die Forschung basiert weitestgehend auf Untersuchungen des Englischen. Wolf et al. (2008) 
präsentieren eine Adaption für das Deutsche. 
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Dass man sich an dieser Stelle keiner geeigneteren linguistischen Wortartendefi- 
nition bedient, die diesen Umstand heilen würde und zugleich der eigenen Ziel- 
setzung entgegenkäme, macht dieses Vorgehen methodisch angreifbar. 

Stattdessen bildet die Psychologie für die Pronomina drei große Gruppen 
(self-references, mutual and group references und other references), in denen die 
Personal-, Possessiv- und Reflexivpronomina aufgehen. Die Klasse der self-refer- 
ences wird definiert als ,,[s]peakers’ references to themselves or their experiences, 
usually indexed by the use of personal pronouns such as I, me, mine, and myself“ 
(DePaulo et al. 2003: 114). Die Klasse der mutual and group references umfasst 
„[slpeakers’ references to themselves and others, usually indexed by the use of 
second-person pronouns such as we, us, and ours“ (DePaulo et al. 2003: 114). 
Die sogenannten other references sind „speakers’ references to others or their ex- 
periences, usually indexed by the use of third-person pronouns such as he, she, 
they, or them“ (DePaulo et al. 2003: 115). Pronomina der 2. Person gelten als refe- 
rences to others, allerdings werden sie nicht immer berücksichtigt. Bei Newman 
et al. (vgl. 2003: 670) werden nur die Formen der 1. und 3. Person erfasst. Hauchs 
(2016) Meta-Analyse differenziert zusätzlich zwischen der Gesamtheit der ver- 
wendeten Pronomina und denen der 2. und 3. Person. Bei den Pronomen der 1. 
Person bilden Singular und Plural jeweils eigene Kategorien. 


2.1.1 Zuordnungsprobleme 


Auffällig an dieser Einteilung ist, dass die Pronomen der 2. Person Singular wie 
Plural kaum Erwähnung finden. Da sie auf die Hörerrolle verweisen, gehören sie 
weder zu den Selbst-Referenzen noch zur Gruppe der mutualand group references. 
Auch zu it findet sich keine Angabe, so dass unklar bleibt, ob es zur Gruppe von 
he, she, they oder them zu zählen oder als „anaphoric“ oder „impersonal“ (Stir- 
ling & Huddleston 2002: 1468, 1481) einer anderen Klasse zuzuordnen ist." Ange- 
sichts dieser Definition von Elementen und ihren Klassen (wie z.B. bei DePaulo 
2003: 114) wird deutlich, dass weder die Klassenbildung eindeutig ist, noch dass 
alle Pronomina von der Kategorisierung erfasst und einer der Klassen zugewiesen 
würden. Aus der Nicht-Erwähnung bestimmter Pronomen kann man nur schlie- 


10 Dabei handelt es sich offenbar um ein Versehen, gemeint sind die Pronomina der 1. Person 
Plural. 

11 Tausczik & Pennebaker (vgl. 2010: 40) klassifizieren it als indefinit. Dieser widersprüchliche 
Umgang mit it ist symptomatisch dafür, dass Überlegungen zu Inhalt und Funktion grammati- 
scher Kategorien keine Rolle spielen. 
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ßen, dass ihre Kategorisierung entweder schwankt oder ganz unterbleibt, weil sie 
für die Psychologie keine Rolle spielen. Da jedoch mit der Wortart Pronomen und 
mit Teilen ihrer Elemente operiert wird, sollten für die Untersuchung irrelevante 
Pronomen wenigstens explizit und wohl begründet von der Kategorisierung aus- 
geschlossen werden, da sonst weder die Klasse noch die Menge der ihr zugewie- 
senen Elemente eindeutig definiert sind und dies methodologisch ein Problem 
darstellt. 

Die Einteilung der Pronomina, soweit sie vorgenommen ist, orientiert sich 
nichtsdestotrotz an der grammatischen Person, und spiegelt damit die implizite 
Annahme, dass sich Unterschiede in der Referenz und damit Unterschiede in ih- 
rer Verwendung (ausschließlich) entlang der grammatischen Kategorie der Per- 
son bewegten.” Zugleich verweist diese Auffassung auch darauf, dass Referenz 
im Zusammenhang mit der Wortsemantik gesehen wird. Untersuchungen zu Ab- 
grenzungsproblemen von Wortarten und deren Definition haben jedoch wieder- 
holt gezeigt, dass 


semantische und pragmatische Kategorien prinzipiell grammatisiert werden [können], 
müssen es aber nicht, denn phonomorphosyntaktische Regeln und Regularitäten, die lexi- 
kalische Einheiten betreffen, können sich prinzipiell auch auf andere als semantisch-prag- 
matische Eigenschaften dieser Einheiten beziehen. (Plank 1984: 491) 


Folglich lässt sich auch bei einem Pronomen die semantisch-pragmatische Funk- 
tion nicht zwingend aus den grammatischen Eigenschaften seiner Wortform ab- 
leiten. 


2.1.2 Primäre und sekundäre Gebrauchsweisen 


Üblicherweise referieren die Personalpronomen der 1. und 2. Person auf die Trä- 
ger kommunikativer Rollen, wobei ich die Sprecherrolle bezeichnet, wir die Grup- 
pe, der sich der Sprecher zurechnet und für die er stellvertretend spricht, du die 
Hörerrolle und ihr die Gruppe, zu der der bzw. die Hörer zählt bzw. zählen. Die 
Personalpronomen der 3. Person beziehen sich auf das Besprochene bzw. auf Per- 
sonen jenseits der Träger der kommunikativen Rollen. Soweit das Besprochene 
nur aus der Kommunikationssituation heraus identifizierbar ist, ist der Gebrauch 
der 3. Person deiktisch, in anderen Fällen ist er anaphorisch. Dieser Gebrauch der 
Personalpronomina gilt als ihr primärer Gebrauch. Daneben existieren „kommu- 


12 Inwieweit der Ausschluss von it auf einer irrtümlichen Gleichsetzung von grammatischer mit 
‚echter‘ Person beruht bzw. von Genus mit Sexus, kann nicht entschieden werden. 
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nikativ bedingte Gebrauchsvariationen“ (Heidolph et al. 1981: 651), auch sekun- 
därer Gebrauch oder secondary use genannt (vgl. Stirling & Huddleston 2002: 
1467), bei denen auf den Sprecher, den Angesprochenen oder andere Personen 
mittels anderer Pronomina verwiesen werden kann. Sprecher nutzen sie gezielt 
für kommunikative Vorteile (vgl. DeCock & Kluge 2016: 351), um z.B. eine Per- 
spektivenänderung beim Gegenüber hervorzurufen. Ihre Analyse kann unter 
kommunikativ-pragmatischen Gesichtspunkten daher sehr aufschlussreich sein; 
sie erlaubt z.B. Einsichten in die Intentionen eines Sprechers. Aus diesem Grund 
sollte eine psychologische Analyse, die die Psyche des Sprechers erkunden will, 
den Erscheinungsformen sekundärer Gebrauchsweisen besondere Aufmerksam- 
keit schenken. 

Sekundäre Gebrauchsweisen sind keineswegs unüblich und bewirken auch 
keine kommunikativen Störungen. Dass sie vom Gegenüber problemlos verstan- 
den werden, erklärt bspw. Kluge mit Rückgriff auf das Mental-Space-Modell, das 
deiktische Pronomina als Mittel interpretiert, die einen deictic shift bewirken (vgl. 
Kluge 2016: 508). Studien der Kognitionsforschung haben gezeigt, dass Men- 
schen dazu tendieren, die durch das Subjekt (in unserem Fall das Pronomen) ei- 
nes Satzes vorgegebene Perspektive einzunehmen (vgl. Sato & Bergen 2013: 362), 
und bestätigen damit indirekt die Wirksamkeit sekundärer Gebrauchsweisen. 

Von den primären” Gebrauchsweisen unterscheiden sich die sekundären in 
zweierlei Hinsicht. Einerseits kann mit dem Pronomen, das prototypisch auf eine 
der kommunikativen Rollen verweist, auch auf andere Personen bzw. Gesprächs- 
teilnehmer verwiesen werden, andererseits kann der Sprecher andere Pronomen 
nutzen, um auf sich, den Hörer oder auf andere zu verweisen. So ist mit dem be- 
treffenden Pronomen in den Beispielen unter (1)—(5)" der Sprecher gemeint: 

(1) [Der Sprecher erzählt:] Da fährst du zum Alexanderplatz und dann ist sie nicht 
da. 

(2) Wie wirst du mit deiner Arbeit fertig? - Man tut, was man kann. (GG: 653) 

(3) [In einem Lehrbuch]: Im folgenden Kapitel werden wir [...] Antennen behan- 

deln. (GG: 653) 

(4) [Arzt zum Patienten]: Schauen wir uns mal Ihr gebrochenes Bein an. 
(5) (Mary zu anderen): Das macht Ann. Ann: Nein, das wird sie nicht tun. (vgl. EG: 

1646) 


13 Je nach Ansatz wird auch von prototypischen oder kanonischen Verwendungsweisen ge- 
sprochen. 

14 Beispiele, die Stirling & Huddleston (EG), Heidolph et al. (GG), Zifonun et al. (GdS) sowie 
Zobel (Z) entnommen sind, sind entsprechend gekennzeichnet. 
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Inwieweit auch andere Lesarten aktiviert werden, hängt in (1) und in (2) von der 
Verallgemeinerbarkeit der Situation ab. Wenn der Sprecher in (1) von einer indi- 
viduellen persönlichen Erfahrung berichtet, ist die Lesart des du als ich eindeutig. 
Teilt der Hörer potenziell die Erfahrung, kann das du auch generisch interpretiert 
werden. Auch in Beispiel (2) ist die Möglichkeit, man statt ich zur Referenz auf 
sich selbst zu verwenden, dann vorhanden, wenn das beschriebene Verhalten 
generalisierbar ist. Eine Antwort wie man hat noch drei Räder zu montieren be- 
werten Heidolph et al. (1981: 653) dementsprechend als nicht möglich. 

Ob das wir in (3) und (4) als Substitut für ich aufgefasst wird, hängt zusätzlich 
davon ab, ob es inklusiv oder exklusiv vom Sprecher benutzt bzw. vom Hörer in- 
terpretiert wird. Nur der exklusive Gebrauch erlaubt die Interpretation als sekun- 
däre Gebrauchsweise. Dementsprechend schließt auch das sogenannte auktori- 
ale wir in (3) und das wir in (4) eine Einbeziehung des Angesprochenen nicht 
gänzlich aus, auch wenn es in (3) nur der Autor ist, der das Thema behandelt und 
in (4) der Arzt, der das Bein betrachtet. Eindeutigkeit gewinnen die sekundären 
Gebrauchsweisen vorrangig dann, wenn ausgeschlossen ist, dass der Referent 
der primären Gebrauchsweise das, was die Proposition beschreibt, realisiert hat 
oder es realisieren könnte. Beispiel (5) weicht von den übrigen Beispielen da- 
durch ab, dass diese Form der Referenz auf einer Metaebene den Verstoß gegen 
kommunikative Konventionen thematisiert.” 

Für der Verweis auf den oder die Angesprochenen stehen ebenfalls mehreren 
Möglichkeiten zur Verfügung: 

(6) Man wäscht sich die Hände, bevor man ißt. (GG: 655) 
(7) Wie fühlt man sich so als junger Ehemann? (GG: 655) 
(8) Wir machen jetzt unsere Hefte zu. (GG: 654) 


Auch hier gilt, dass die Kontextbedingungen darüber entscheiden, ob das jewei- 
lige Pronomen als sekundäre Gebrauchsweise zu interpretieren ist. In (6) setzt 
dies voraus, dass die Beteiligten das Verhalten von man auf das Verhalten des 
Kindes beziehen, aus dem dann seinerseits die Aufforderung wasch dir die Hände 
abzuleiten wäre. In (7) impliziert die Frage, dass es allgemein einen Unterschied 
im Erleben gibt, den auch der Angesprochene erfahren haben sollte. Der Ange- 


15 Ann sanktioniert das Versäumnis von Mary, vorher nicht mit ihr gesprochen zu haben, in- 
dem sie es durch den abweichenden Pronomengebrauch der 3. Person sichtbar macht (vgl. Stir- 
ling & Huddleston 2002: 1464) 

16 Diese Verwendungen kommen insbesondere in Situationen vor, in denen der Angespro- 
chene die „sozial untergeordnete Rolle innehat“ (GG: 654 f.) (6, 8) bzw. der Sprecher zu einem 
allgemeinen Verhalten auffordert oder danach fragt (7). 
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sprochene muss erst ableiten, dass er mit man gemeint ist. Eine sekundäre Ge- 

brauchsweise liegt in (8) nur dann vor, wenn die Lehrerin ihr Heft nicht schließt. 
Referenz auf nicht identifizierbare Dritte als unbestimmte oder generische 

Referenz kann wie folgt geschehen: ” 

(9) Ich kann doch als Kunde nicht immer davon ausgehen, dass ... (Z: 388) 

(10) Wie lösche ich einen Brand? (GG: 653) 

(11) Hast du was, dann bist du was. 

(12) Wenn wir 9 durch 3 teilen, erhalten wir 3. 


Eine Disambiguierung zwischen primärer und sekundärer Gebrauchsweise ist in 
Verwendungen wie (9) und (10) nicht abschließend möglich. Nur in Fällen wie 
„Ich muss als Mannschaft auf bestimmte Spielsituationen umstellen können“ 
(Zobel 2016: 389) analog zu (9) ist der unpersönliche Gebrauch durch den Bezug 
des ich auf Mannschaft eindeutig. Für (11) und (12) gilt, dass das Gesagte zwar 
auch auf das Gegenüber bzw. die Gruppe zutrifft, aber eben nicht ausschließlich, 
daher kann alternativ auch man verwendet werden. Da sich primäre und sekun- 
däre Gebrauchsweisen morphosyntaktisch nicht unterscheiden, lenken ggf. Mo- 
duswahl, Temporal- oder Lokaladverbien oder weitere Pronomina die Interpreta- 
tion zugunsten einer von beiden Lesarten (vgl. Zobel 2016: 391). 

Mit jedem der hier aufgeführten Pronomen kann demnach mindestens eine 
Variante des sekundären Gebrauchs realisiert werden, wenn auch einige der vor- 
gestellten Gebrauchsweisen an recht spezifische Kontexte gebunden sind. Für 
andere jedoch, wie die des du in (1) und (11) gilt, dass sie regelmäßig und zum 
Teil gehäuft in Erzählungen auftreten, denn Erzählungen haben zum Ziel, den 
Zuhörer in eine bestimmte Szenerie einzuführen und mental die Haltung des Fr- 
zählers oder die einer anderen Person einzunehmen (vgl. Kluge 2016: 508). Da 
die Datengrundlage der meisten Studien der psychologischen Täuschungsfor- 
schung Erzählungen selbsterlebter Ereignisse sind (vgl. z.B. Hauch 2016: 38), 
sind diese sekundären Gebrauchsweisen zu erwarten. Die Wahl der Hörerdeixis 
mittels du reicht dabei in ihrem Einsatz vom Selbstgespräch in (13) über die Ein- 
beziehung des Angesprochenen in (14) bis zur generischen Verweisform, die sich 
nicht (mehr) explizit an den Hörer in (15) richtet: 

(13) Zuerst hab’ ich gedacht: „Man [sic], bist du blöd, du kapierst überhaupt 

nicht, was der schreibt.“ (GdS: 318) 

(14) Da fährst du nun zum Alexanderplatz, wartest eine ganze Stunde auf deinen 

Freund und mußt dann feststellen, daß er dich versetzt hat. (GG: 652) 


17 Alle Pronomina können hier durch man ersetzt werden. Die Auflistung der sekundären Ge- 
brauchsweisen insgesamt ist nicht erschöpfend. 
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(15) Nur wenn bestimmte Normen akzeptiert werden, dann bist du was. (GdS: 
318) 


Dabei lässt sich die Ambiguität zwischen der deiktischen und der nicht-deikti- 
schen Verwendungsweisen einer Äußerung nicht immer auflösen.! Die Verbin- 
dung zwischen beiden Gebrauchsweisen liegt darin, dass das, was für Menschen 
im Allgemeinen gilt, auch für den Angesprochenen persönlich gilt, auch wenn 
der Angesprochene im konkreten Fall der Äußerung nicht gemeint sein muss 
(vgl. Stirling & Huddleston 2002: 1468). Selbst wenn man du in Beispiel (15) nicht 
nur durch man, sondern durch ich ersetzt, bleibt bei diesen Beschreibungen all- 
gemeinen Verhaltens die unbestimmte Referenz auf andere Personen erhalten 
(vgl. dazu auch Zobel 2016): 

(15°) Nur wenn bestimmte Normen akzeptiert werden, dann ist man was. 

(15°) Nur wenn bestimmte Normen akzeptiert werden, dann bin ich was. 


Dieser Effekt zeigt sich auch in umgekehrter Form bei potentiell individuellen Er- 

fahrungen, auch wenn diese sich verallgemeinern lassen. Während in (16) eine 

Ersetzung des du mit man an der generischen Lesart nichts ändert, verliert die 

Äußerung mit dem ich ihre Generalisierbarkeit: 

(16) Wenn du auf dem Alexanderplatz stehst, weißt du nicht, wohin du zuerst 
schauen sollst. (GG: 654) 

(16°) Wenn man auf dem Alexanderplatz steht, weiß man nicht, wohin man zu- 
erst schauen soll. (GG: 654) 

(16°) Wenn ich auf dem Alexanderplatz stehe, weiß ich nicht, wohin ich zuerst 
schauen soll. (GG: 654) 


Der Grad der Allgemeingültigkeit eines Äußerungsinhalts hat demnach Einfluss 
darauf, welche Möglichkeiten der Referenz das Pronomen im betreffenden Kon- 
text bereitstellt. Je nach Thema und Einstellung des Sprechers zum Thema muss 
damit gerechnet werden, dass seine Äußerungen auch sekundäre pronominale 
Gebrauchsweisen unterschiedlicher Art aufweisen. Diese Gebrauchsweisen las- 
sen sich jedoch nur durch qualitative Analysen erfassen, nicht über die frequenz- 
basierte Auswertung von Oberflächenmerkmalen. Letzteres setzt sich dann dem 
methodologischen Vorwurf aus, dem Untersuchungsgegenstand nicht angemes- 
sen zu sein. 


18 Hörer wenden daher verschiedene Strategien an, mit deren Hilfe die Ambiguität im Laufe der 
Kommunikationssituation wieder aufgelöst werden kann (vgl. Kluge 2016). 
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2.2 Referenz 


Linguistisch lässt sich Referenz als eine sprachliche Handlung beschreiben, mit 
der im Rahmen des Äußerungsakts der Bezug eines denotierenden Ausdrucks zu 
einem Referenten hergestellt wird (vgl. Levinson 2000: 659)."” Wenn das, worauf 
referiert wird, durch den Äußerungskontext determiniert ist, spricht man von 
Deixis, entsprechend ist Deixis eine Sonderform der (definiten) Referenz (vgl. 
Herbermann 1988: 51 f.). 

Die fehlende Reflexion des Referenzbegriffs in der psychologischen Literatur 
zur Täuschungsforschung legt nahe, dass Referenz dort nicht linguistisch, son- 
dern allgemeinsprachlich zu verstehen ist, auch, weil sie nicht im Verhältnis zu 
Deixis definiert wird. Dennoch kann insoweit auf einen zugrundeliegenden Refe- 
renzbegriff geschlossen werden, als nur die Formen des primären Gebrauchs be- 
rücksichtigt werden. Referenz beschreibt dann einen eindeutigen semantischen 
Bezug der Wortform zu ihrem Referenten, und die Semantik des Deiktikons wäre 
dann mit einer bestimmten Gebrauchsweise gleichzusetzen bzw. würde diese 
vorgeben.” Du z.B. verwiese dann stets nur auf den Hörer/Angesprochenen und 
niemals auf den Sprecher. Sekundäre Gebrauchsweisen gäbe es in diesem Sinne 
nicht. 

Diese Auffassung korrespondiert mit einem repräsentationistischen Zeichen- 
begriff, der in seinem Kern besagt, dass Zeichen (wie Pronomen) für etwas ste- 
hen. Sie werden von den Sprechern benutzt, weil sie ihre Vorstellungen anderen 
mitteilen wollen. Ich hätte in diesem Sinne nur eine Bedeutung, die zu verstehen 
ist als die gleiche Vorstellung von ich, die alle Sprecher einer Gemeinschaft teilen 
(vgl. Keller 2018: 68). 

Problematisch ist an dieser Herangehensweise zweierlei. Zum einen unter- 
bleibt die grundlegende Unterscheidung nach deiktischen Ausdrücken und deik- 
tischem Gebrauch (vgl. Diessel 2012: 2408) mit der Folge, dass beides miteinan- 
der gleichgesetzt wird. Der zweite Punkt betrifft die an die Analyse der Selbst- 
Referenz geknüpfte Zielsetzung der psychologischen Studien der Täuschungsfor- 
schung. Für andersgeartete Untersuchungen kann dieser Referenzbegriff ange- 
bracht und geeignet sein. Die Studien der Täuschungsforschung untersuchen je- 
doch den Sprachgebrauch der Probanden explizit mit dem Ziel, deren innere 
Haltung oder sogar psychische Verfasstheit daraus abzuleiten. Linguistisch bese- 


19 Zur Rolle des Äußerungsakts Ehlich (vgl. 2007: 208). 
20 Nach dieser Auffassung verweisen nicht Sprecher mittels ich auf ihre Sprecherrolle, sondern 
der Ausdruck ich referiert auf den Sprecher (vgl. die Erläuterung bei Searle 1983: 46). 
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hen setzt eine solche Zielsetzung eine funktionale Sprachauffassung zwingend 
voraus, so dass es unumgänglich ist, auch Referenz pragmatisch zu definieren.” 

Geht man also davon aus, dass Selbst-Referenz in der Täuschungsforschung 
als Konzept Anwendung finden soll, das der Überprüfung einer funktional bzw. 
pragmatisch basierten Hypothese zum Sprachgebrauch dient, dann muss die 
Klasse der sprachlichen Elemente, deren Untersuchung diese Hypothese belegen 
soll, auch pragmatisch definiert sein. Die Pronomina, die in dieser Klasse enthal- 
ten wären, würden funktional eine solche Selbst-Referenz ausdrücken. In der 
Konsequenz beschränkte sich die Klasse der ‚Selbst-Referenz‘-Pronomina dann 
nicht nur auf die Pronomen der 1. Person Singular, sondern würde auch andere 
Pronomen enthalten, deren ‚selbst-referentielle‘ Verwendung in der betreffenden 
Situation eine spezifische Funktion erfüllt, welche nur so und nicht anders aus- 
gedrückt werden kann. 

So, wie die Auswertung des Pronomengebrauchs in Studien der Täuschungs- 
forschung gemeinhin vorgenommen wird, handelt es sich tatsächlich aber um 
die bloße Ermittlung der Vorkommenshäufigkeiten von ich und seinen morpho- 
logisch verwandten Formen. Die Hypothese, dass Lügner einen geringeren Anteil 
an Selbst-Referenzen aufweisen würden, wäre dann in dieser Form nicht haltbar. 
Wollte man die Erhebung der Lexeme ich, mein, mich etc. als relevant rechtferti- 
gen, müsste die Hypothese dahingehend geändert werden, dass Lügner weniger 
häufig in der 1. Person Singular sprechen. Auf den Begriff der Selbst-Referenz 
wäre dann zu verzichten, was aber bedeuten würde, dass damit das sprachliche 
Verhalten der betreffenden Personen nicht mehr als Versuch erklärt werden 
könnte, sich von der eigenen Aussage und damit von sich selbst zu distanzieren.” 
Die Vorkommenshäufigkeit der Formen der 1. Person Singular zu betrachten, 
würde „auf der grammatischen Beschreibungsebene, die dabei weitgehend iso- 
liert wird“ (Brinker 1989: 13), operieren und ließe andere Ebenen der Textproduk- 
tion unberücksichtigt. Da ein pragmatischer Ansatz am ehesten die kommunika- 
tive Steuerung der Textproduktion erfassen kann, wäre der Gebrauch von ich 
zunächst in eine pragmatische Beschreibung zu integrieren, bevor Aussagen zur 
Aussagekraft seines Vorkommens gemacht werden können (vgl. Brinker 2010: 
16). 


21 Vgl. auch Diessel (2012: 2408): „Thus, any account of natural deixis has to start from a prag- 
matic theory of language use and human cognition“. 

22 Diese Beschränkungen in der Wortwahl gibt es, so z.B. bei Fuller et al. (2011), was aber nicht 
heißt, dass dies einer Reflexion des Referenzbegriffs geschuldet ist, denn die pragmatische 
Funktion von ich/mein wird nicht thematisiert. 
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Problematischer ist jedoch, dass die Annahme, dass Lügner weniger häufig 
auf sich selbst referieren, nicht haltbar ist, weil keine Aussage zur Gesamtheit der 
vorhandenen Selbstreferenzen gemacht werden kann. Eine Kategorie ‚Selbst-Re- 
ferenz‘, die Pronomina nur nach ihren primären Gebrauchsweisen beschreibt, ist 
damit unvollständig und kann aufgrund mangelnder Funktionsbeschreibung 
nicht erfassen, was sie vorgibt, abzubilden. Verursacht ist dies durch die nicht 
reflektierte Auffassung von Referenz auf höherer Ebene, denn jede Theorie der 
Referenz muss Lösungen auch für den nicht-kanonischen Gebrauch der Prono- 
men anbieten (vgl. DeCock & Kluge 2016: 351). 

Als Folge davon wären Auswertungen von Texten, die angeblich einen gerin- 
geren Anteil an Selbstreferenzen enthalten, erneut dahingehend zu analysieren, 
ob der betreffende Sprecher tatsächlich nur mit den erfassten Wortformen auf 
sich selbst referiert oder ob er noch andere, sekundäre Formen verwendet und 
wie diese gebraucht werden. In jedem Fall muss man sich Klarheit über die Funk- 
tionalität der Pronomina verschaffen, deren unterschiedliche Aspekte mit den 
Begriffen von Deixis, Referenz und Phorik linguistisch umfassend beschrieben 
sind. 


3 Zum Sprachgebrauch 


3.1 Psyche und kommunikative Ziele 


Die Tauschungsforschung” geht im Allgemeinen von einem direkten Zusammen- 
hang von Sprache und Psyche einer Person aus und ist in Hinblick auf die Spra- 
che primär an solchen Veränderungen interessiert, die als Ausdruck der kogniti- 
ven und psychischen Verfassung der jeweiligen Person gelten, beispielsweise 
solchen, die sprachlich eine kognitive Anstrengung reflektieren (als Teil der Cog- 
nitive-load-Hypothese) oder die Schuldgefühle darüber ausdrücken, dass gelo- 
gen wird (als Teil der Guilt-Hypothese). Damit sieht die Psychologie einen be- 
stimmten Sprachgebrauch als Symptom und interpretiert Änderungen z.B. im 
Pronomengebrauch einer Person als Indikator ihres psychischen Zustandes. Eine 
direkte Verbindung wird auch zwischen Verantwortlichkeit und Sprachgebrauch 
hergestellt, wenn es heißt, ,,[t]he use of the first-person singular is a subtle pro- 
clamation of one’s ownership of a statement“ (Newman et al. 2003: 666). Wer 


23 Z.B. Campell & Pennebaker (2003), Pennebaker & King (1999). 
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folglich nicht hinter seinen Äußerungen stehe, vermeide Pronomen der ersten 
Person. Linguistisch lässt sich dieser Argumentationslinie sicher einiges entge- 
gensetzen. So dient der Gebrauch der Pronomina der ersten Person zunächst nur 
dazu, die Aufmerksamkeit des Hörers auf den Sprecher zu lenken (vgl. Ehlich 
2007: 127) und diese Sprecherrolle zu verbalisieren. Jeder Sprecher proklamiert 
das, was er sagt, schlicht als seine Äußerung genau im Moment des Äußerungs- 
aktes, unabhängig von jeglichem Pronomengebrauch. Wenn er der Ansicht ist, 
dass der Hörer zusätzliche Informationen zum Gültigkeitsgrad bzw. zum Wahr- 
heitsgehalt der betreffenden Proposition erhalten soll, hat der Sprecher die Mög- 
lichkeit, dies mit seiner Wortwahl anzuzeigen, indem er z.B. Partikeln, Kommen- 
taradverbien oder auch sekundäre Gebrauchsweisen der Pronomina wählt. 

Die Erklärung eines bestimmten Sprachgebrauchs durch die Psyche basiert 
auf der in der Psychologie verbreiteten Auffassung, dass Sprache vorrangig dazu 
dient, Gedanken und Gefühle unmittelbar auszudrücken (vgl. Groom & Penneba- 
ker 2002: 616, Schober 2007: 435). Ein Sprecher wählt in diesem Sinne Wortfor- 
men in direkter Abhängigkeit von seinem psychischen Zustand, daher kann so 
aus dem Ergebnis auch auf die innere Verfassung geschlossen werden. Da ver- 
bale wie non-verbale Lügensignale vom Sprecher nicht willentlich gegeben wer- 
den, wäre Sprachgebrauch dann etwas, das nicht zweckgebunden realisiert wür- 
de, sondern sich im konkreten Fall einfach Bahn bräche. Gegen diese Auffassung 
argumentieren Burgoon et al. (1999: 683) mit dem Einwand, dass 


when deception moves into interactive contexts, a deceiver’s behavior is no longer a prod- 
uct of internal psychological forces alone but instead increasingly becomes responsive to 
that of the partner [...]. 


Linguistisch betrachtet, offenbart ein Sprecher, der weniger häufig ich gebraucht, 
nicht seine psychische Verfassung oder Unaufrichtigkeit, sondern er referiert in 
dieser oder jener Form aus mannigfaltig bedingten Gründen, die sich aus der 
Komplexität der Kommunikationssituation ergeben und zu der natürlich auch er 
und seine psychische Verfassung gehören. Betreffende Strategien sind bereits 
mit Mitteln der Pragmatik und der Stilistik z.T. ausführlich beschrieben worden 
(vgl. z.B. Galasihski 2000 oder McCornack 1992). Angesichts der Nicht-Replizier- 
barkeit™ der Ergebnisse vieler Studien zu bestimmten verbalen Lügenindikatoren 
(einschließlich der Selbst-Referenz) resümieren Burgoon et al. (1999: 683): 


24 Vgl. Ali & Levine (2008: 84, 87), Hauch et al. (2015: 314), Hauch (2016: 36). 
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If deception research is to capture the realities of actual human interaction, it must become 
increasingly cognizant of the role that factors such as communicator goals and skills and 
the interaction between deceiver and target exert on deception displays. 


3.2 Inter- und intrapersonale Variation 


Schaut man sich die Experimentalanordnung vieler Studien an, so wird schnell 
deutlich, dass das Forschungsinteresse üblicherweise nicht dem Sprachverhal- 
ten einzelner gilt, sondern der jeweiligen Personengruppe, die lügt bzw. die 
Wahrheit sagt. Hintergrund ist die Annahme, dass eine allgemeinere Form des 
wahrheitsgemäßen Sprechens existiert, die sich vom Lügen abgrenzen lässt. Die- 
se Annahme beruht auf dem Konzept von immediacy/non-immediacy, das von 
Wiener & Mehrabian (1968) im Rahmen klinisch-psychologischer Studien formu- 
liert wurde und das viele Studien zu verbalen Lügenindikatoren übernommen 
haben.” Die zentrale Hypothese besagt, dass Personen, die sich sprachlich un- 
mittelbar bzw. immediate ausdrücken, darüber ihre innere Nähe zu dem, worüber 
sie sprechen, signalisieren (vgl. Wiener & Mehrabian 1968: 3). Wiener & Mehra- 
bian zählen dazu, dass diese Personen von sich in der ich-Form sprechen, als 
Zeitform das Präsens Aktiv benutzen und konkret in ihren Aussagen sind. Ent- 
sprechend drückt sich non-immediacy durch den Gebrauch anderer sprachlicher 
Mittel wie z.B. Passivsätze oder sog. generalisierende Ausdrücke aus und theore- 
tisch auch durch den Gebrauch sekundärer Gebrauchsweisen im Zusammenhang 
mit Selbst-Referenz. Viele Folgestudien haben diese Form sprachlicher Distanzie- 
rung mit dem Lügen verbunden und dementsprechend den Pronomengebrauch 
unter dem Aspekt der immediacy bzw. non-immediacy subsumiert. Sicherlich 
kann das Sprachverhalten einer Person als unmittelbar im Sinne Wiener & Mehr- 
abians beschrieben werden, die Frage ist nur, welchem Zweck es dient und unter 
welchen Bedingungen es in welchem Umfang auftritt. Kurz, es stellt sich die Fra- 
ge, ob dieses Sprachverhalten Menschen, die die Wahrheit sagen, tatsächlich em- 
pirisch nachweisbar auszeichnet. Aufgrund widersprüchlicher Ergebnisse im Be- 
reich der Selbst- und Fremdreferenzen (vgl. z.B. Bond & Lee 2005: 314), sowie bei 
anderen Merkmalen, die der (non-)immediacy zugeschrieben werden, kommen 
einige Studien zu dem Schluss, dass es sich bei non-immediacy weniger um ein 


25 Unter anderem zu ersehen aus den Metastudien von DePaulo et al. (2003) und Hauch (2016). 
Vgl. stellvertretend die Studien von Duran et al. (2010), Hancock et al. (2008) oder Buller et al. 
(1996), die das Vorkommen von weniger Selbst-Referenzen als Teil einer geringeren immediacy 
bei Lügnern (,deceivers‘) untersuchen. 
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Merkmal des Lügens denn um ein davon unabhängiges stilistisches Merkmal 
handelt (vgl. Buller et al. 1996: 283, Burgoon et al. 1999: 683). 

Die Auffassung, dass sich Lügner und Personen, die die Wahrheit sagen, 
sprachlich voneinander trennen lassen (so explizit Newman et al. 2003: 674), hat 
zur Folge, dass das Sprachverhalten des Einzelnen nicht im Vordergrund steht. 
Wenn man wie die Psychologie davon ausgeht, dass sich die psychische Verfas- 
sung des Einzelnen in einem bestimmten Sprachgebrauch widerspiegelt und kog- 
nitive Anstrengung eine messbare körperliche Komponente ist, die bei allen Men- 
schen ein ähnliches Sprachverhalten hervorbringt,? wäre zu erwarten, dass auch 
der Sprachgebrauch des Einzelnen von Merkmalen geprägt ist, die, auch wenn 
sie zahlreich sind, nicht individueller Natur sind. Dieser Sprachgebrauch lässt 
sich nach Meinung der Psychologie über die Vorkommenshaufigkeit bestimmter 
Wortformen identifizieren. Nur so ist nachvollziehbar, dass beim Vergleich des 
Sprachverhaltens eines Lügners gegenüber einer Person, die die Wahrheit sagt, 
Quantität bzw. Frequenz eine Rolle spielt. 

Allerdings handelt es sich nicht primär um das Vorkommen von Lügenmerk- 
malen als solchen, sondern stets um ein Mehr oder Weniger gegenüber dem ,auf- 
richtigen‘ Sprachgebrauch. Nach dem üblichen Design der Studien werden Pro- 
banden aufgefordert, eine erfundene und/oder eine wahre Geschichte wiederzu- 
geben, im Anschluss werden die jeweiligen Geschichten gruppenweise analysiert 
und über die Sprecher hinweg wird die Vorkommenshäufigkeit der Merkmale er- 
mittelt, die das unaufrichtige bzw. lügende Sprachverhalten auszeichnen.” Var- 
tapentiance & Gillam (2012) kritisieren dieses Vorgehen als methodisch unsau- 
ber, wenn sie anmerken, dass ohne baseline (anhand eines Referenzkorpus) nicht 
klar sei, woran sich ein Mehr oder Weniger genau orientiere, denn „[r]elationship 
to some collection-specific average is unlikely to readily produce appropriate re- 
sults“ (ebd.: 8). Entsprechend sei Folgendes nötig: 


So, to be able to detect any deception, work would first need to be done in order to (1) estab- 
lish the frequency ranges for different elements within a specific collection, (2) set thresh- 
olds of deception per collection and per cue, and then (3) manually verify those above and 
below the deception threshold. (ebd.) 


Auch Vrij (2016) bemerkt kritisch, dass das Bewusstsein für die Notwendigkeit 
einer baseline kaum vorhanden ist, obwohl das Verfahren als solches nicht erst 
in jüngeren sondern schon in frühen psychologischen Untersuchungen ange- 
wendet wurde (z.B. Brandt et al. 1980), denn die Vernachlässigung individueller 


26 Zum Beispiel Häsitationen oder Latenzzeiten. 
27 So bei Bond & Lee (2005), Newman et al. (2003). 
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Unterschiede der Sprecher und Sprechsituationen stellt ein grundsätzliches me- 
thodisches Problem dar. Schließlich darf die Egalisierung individueller Unter- 
schiede nicht zu dem Rückschluss verleiten, dass sich Personen beim Lügen und 
beim „Die-Wahrheit-Sagen“ sprachlich gleich verhalten würden. Jeder Einzelne 
variiert in beiden Situationen in unterschiedlicher Form und unterschiedlichem 
Umfang in seinem Sprachgebrauch. Dieses Sprachverhalten, also die individuelle 
‚Basisrate‘, zu kennen, ist die Voraussetzung, um überhaupt bewerten zu kön- 
nen, ob eine Person lügt. Über die oben beschriebene Art der Experimentalanord- 
nung kann eine solche allerdings nicht ermittelt werden (vgl. Hermanutz & Litz- 
cke 2012: 176). 

In Hinblick auf das Testdesign wäre daher ein möglicher erster Schritt, zu- 
nächst das individuelle Sprachverhalten der Probanden (vor dem Hintergrund 
einer Basisrate) zu erfassen und es erst danach mit dem der anderen zu verglei- 
chen. Dabei wäre ein Mechanismus sinnvoll, der das Sprachverhalten des Einzel- 
nenin unterschiedlichen Situationen als multiple individuelle Merkmalsgruppen 
erfassen würde und in dessen Profil integrierte. So würde nicht nur eine inter- 
sondern auch eine intrapersonale Varianz erfasst.”® Auch für die Ermittlung der 
Varianz unter den Bedingungen des Lügens würden sich solche Verfahren anbie- 
ten und könnten möglicherweise auch statistisch zu besseren Ergebnissen füh- 
ren. Die Überführung von gemeinsamen interpersonalen Merkmalen in ein Grup- 
penprofil, die ein dann noch zu definierender Anteil der Probanden unter den 
Bedingungen des Lügens zeigen müsste, stünde allenfalls am Ende einer solchen 
Untersuchung. 

Linguistisch betrachtet, stellt sich die Frage, worum es sich bei einer mut- 
maßlichen Sprache des Lügens, die sich durch bestimmte sprachliche Merkmale 
auszeichnet, handelt; genauer, welchen Status diese hat. Sie als Register zu be- 
werten, würde implizieren, dass sie potentiell gelehrt werden kann, dass sie er- 
worben wird und von den Sprechern bewusst abgerufen und benutzt werden 
kann. Es würde aber auch bedeuten, dass sie dann als solches umgehend von 
anderen Gesprächsteilnehmern erkannt werden könnte, was nachgewiesener- 
maßen nicht der Fall ist. Aus linguistischer Sicht ist dies nicht überraschend, 
denn, so Meibauer (2019: 6), „otherwise the liar would commit ‚illocutionary sui- 
cide‘, i.e., actin a paradoxical way.“ 


28 Für die automatisierte Autorschaftsattribution gibt es entsprechende Verfahren, vgl. z.B. Ab- 
basi & Chen (2008), Schmid et al. (2015). Als ähnlich im Ansatz lässt sich auch Hardins (2019:64) 
Verweis auf „a combination of individual cues offers the most useful association for lie detec- 
tion“ lesen. 
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Aus diesem Grund ist das betreffende Sprachverhalten eher nicht als Regis- 
ter, sondern als individueller nicht-normierter Sprachgebrauch einzustufen, der 
im Kontext des Lügens realisiert wird. Dabei nutzen Sprecher eine Reihe inter- 
und intrapersoneller Strategien, wobei die genaue Auswahl nach individuellen 
spezifischen Präferenzen erfolgt. Auswahl und Präferenz sind im Fall des Lügens 
nicht bewusst zugänglich, d.h. die betreffenden Elemente würden dann im Rah- 
men einer stilistischen Betrachtung dem Bereich der unbewussten Wahl zuge- 
rechnet. Inwieweit diese Wahl sich dadurch auszeichnet, dass sie „auf der inter- 
personellen Ebene sowohl qualitative als auch quantitative, intrapersonal dage- 
gen nur quantitative Unterschiede auf[weist]“ (Sinner 2014: 206), wäre zu prüfen. 
Ein entsprechender Vergleich könnte möglicherweise widersprüchliche Befunde 
klären, wie z.B. Ali & Levine (2008: 90) sie in ihrer Studie beschreiben: „while 
verbal indicators of deception appear to exist, they are not consistent from situa- 
tion to situation“. 

Um linguistische Erkenntnisse für die psychologische Täuschungsforschung 
nutzbar machen zu können, müssten die entsprechenden Studien zunächst das 
individuelle Sprachverhalten sowohl beim Lügen wie auch unter ‚normalen‘ Be- 
dingungen in möglichst unterschiedlichen Situationen erfassen. Erst dann ließe 
sich auch ein Mehr oder Weniger einer bestimmten Sprachverwendung so be- 
stimmen, dass es im Rahmen einer stilpragmatischen Analyse als potentielles 
Merkmal genutzt werden könnte. In diesem Sinne ist Hermanutz & Litzcke (2012) 
zuzustimmen, dass die Ermittlung eines Basisverhaltens unter den Bedingungen 
des Nicht-Lügens eine Grundvoraussetzung für jede weitere Analyse darstellt. 

Im Zentrum der Analyse stünde damit der Sprachgebrauch des Einzelnen. 
Wenn sich dieser Sprachgebrauch unter den Bedingungen des Lügens in einer 
nachweisbaren Form ändern würde, können die Unterschiede zwischen den bei- 
den Sprachverwendungen stilistisch beschrieben werden. So sprechen z.B. Ali & 
Levine (2008) auch von deceptive styles. Aber selbst wenn man die Unterschiede 
einzig dem Lügen zuschreiben könnte, handelte es sich bei dieser Art von Lügen- 
merkmalen um Stilmerkmale, und auf sie trifft dasselbe zu, was generell für sti- 
listische Merkmale gilt: Potentiell kann jedes sprachliche Element einen stilisti- 
schen Wert und, wenn aus der Stilanalyse ihrerseits etwas abgeleitet werden soll, 
einen Indikatorwert entwickeln. Wenn nun bestimmten Stilmerkmalen - und da- 
mit auch Lügenmerkmalen - regelmäßig eine distinktive Kraft zugesprochen 
würde, hieße dies nicht, dass diese Merkmale damit auch valide wären. Vielmehr 
wären sie nur Teil einer, wenn auch unter Umständen traditionsreichen, Arbeits- 
hypothese, auf deren Basis die stilistische Analyse eines Textes erfolgen würde. 
Da sich bestimmte Merkmale in der Vergangenheit als aussagekräftig erwiesen 
haben, liegt es natürlich nahe, im Zuge der Analyse nach ihnen Ausschau zu 
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halten. Ihr Vorhandensein mag ein erster Indikator sein, doch erst in der Bear- 
beitung des Einzelfalls würde sich zeigen, ob das betreffende Element auch hier 
eine Indikatorfunktion hätte. Mit Blick auf die Liigenmerkmale würde dies be- 
deuten, dass das, was den Einzelnen beim Lügen sprachlich auszeichnet, indivi- 
duell ist. Eine klassenweise Auswertung bestimmter verbaler Merkmale unter- 
schiedlicher Gruppen, die nach Art eines top-down-Verfahrens potentiell das Ziel 
hat, so auch den Einzelnen als Lügner zu identifizieren, erscheint daher in der 
Zusammenschau methodisch verfehlt. Es bedeutet jedoch nicht, dass sich diese 
Merkmale in einem zweiten Schritt über die Auswertung des individuellen Sprach- 
gebrauchs vieler (als bottom-up) nicht doch als gemeinsam geteilte Merkmale er- 
weisen könnten. 


3.3 Stilkonzepte 


Ungeachtet der Relevanz des Sprachgebrauchs für die Täuschungsforschung be- 
gegnet man konkreten Hinweisen zu Sprache und Stil kaum - ein Missverhältnis, 
das auch Schober (vgl. 2007: 435) konstatiert. Zumeist müssen, wie oben bereits 
angesprochen, die jeweils zugrunde gelegten Stil- bzw. Sprachauffassungen in- 
direkt erschlossen werden. Die wenigen expliziten Ausführungen, die sich fin- 
den, bieten ähnlich den Studien zur automatisierten Autorschaftsattribution un- 
einheitliche und sich zum Teil widersprechende Einschätzungen von Stil. Essind 
vor allem Studien der Gruppe um Pennebaker, deren Verfasser sich zu stilisti- 
schen und sprachlichen Fragen äußern, ohne dass die betreffenden Erörterungen 
eine ernstzunehmende linguistische Grundlage hätten.” Pennebaker & Graybeal 
(2001: 92) gehen z.B. davon aus, dass Stil über Zeit, Raum und Textsorte stabil 
sei: „[A] person who uses first person singular, past tense [...] in one writing as- 
signment [...] will tend to use the same linguistic categories to the same degree in 
other writing samples“. Pennebaker & King (1999: 1296) sind der Auffassung, 
dass ,,written language is also unique from person to person“, eine Annahme, die 
als unzutreffend gelten muss, ebenso wie die Behauptung von Pennebaker & 
Graybeal (2001), dass Stil individuell und einzigartig sei. Aber auch, wenn man 
von der Existenz eines Stils des Liigens ausgeht, stellen sich die bekannten Fra- 
gen nach der Beschaffenheit dieses Stils, seiner Identifizierbarkeit und seiner Ab- 


29 Exemplarisch sei hier auf die Erérterungen zum bestimmten und unbestimmten Artikel (the, 
a, an) verwiesen. Ihre in verschiedener Hinsicht unzutreffende Definition als ,,all three words 
serve the same function which is to signal the upcoming use of a concrete noun“ (Tausczik & 
Pennebaker 2010: 28) blendet Funktion und Komplexität der Verwendungsbedingungen des Ar- 
tikels sowie ihre linguistische Erforschung vollständig aus. 
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grenzbarkeit (vgl. Fobbe 2011: 130 und Fobbe 2021). Dass der Sprachgebrauch, 
der das Lügen begleitet, individuell geprägt ist, heißt nicht, dass er sich von an- 
deren Stilen unterscheiden muss oder eindeutig einer Person zuzuordnen wäre. 
In diese Richtung weist auch das Ergebnis von Burgoon et al. (1999: 683), die re- 
sümieren: 


The six linguistic indices measured here - levelers, modifiers, self-references, group-refer- 
ences, present tense verbs, and past tense verbs — showed several significant changes over 
time but no significant effects due to deception itself. Thus, senders were able to maintain 
similar verbal styles while deceiving and while telling the truth. 


In anderen Fallen erlauben die Fragestellungen bzw. Zielsetzungen der Autoren 
Rückschlüsse auf die jeweilige Stilauffassung und mit welchen Annahmen zu 
Sprache und Sprachgebrauch die Autoren operieren. Der Sprachgebrauch unter 
den Bedingungen des Lügens wird im Allgemeinen als das Ergebnis einer dem 
Bewusstsein nicht zugänglichen Wahl gewertet, die zugleich als Abweichung in- 
terpretiert wird, aber diese Prozedur verstehen die Autoren nicht als Teil der Pro- 
duktion von Stil. Auch ohne expliziten Verweis auf Stil ist klar zu erkennen, dass 
die Sprachverwendung im Kontext des Lügens stets im Kontrast zu dem Sprach- 
verhalten betrachtet wird, das Personen zeigen, wenn sie die Wahrheit sagen. 
Damit ist die zugrunde liegende Stilauffassung tendenziell deviatorischer 
Natur, bei der das ‚aufrichtige Sprachverhalten‘ als Norm gilt, von dem unter dem 
Einfluss des Lügens zudem unbewusst in negativer Art und Weise (weniger 
Selbst-Referenzen, mehr negative Wörter) abgewichen wird. Dabei wird voraus- 
gesetzt, dass hinsichtlich der Variationsmöglichkeiten von sprachlichen Elemen- 
ten und somit auch für den gesamten Pronomengebrauch keine anderen Be- 
schränkungen bestehen würden, als solche, die durch die Psyche des Sprechers 
verursacht sind. Dass grammatische Restriktionen und fehlende Alternativen 
diese Wahl sehr wohl beeinflussen, wird nicht in Betracht gezogen. Insofern sind 
Einwände sprachstruktureller Natur, wie sie auch in der Täuschungsforschung 
selbst formuliert werden, nicht trivial, denn zum einen relativieren sie den An- 
spruch, dass die größtenteils über englische Sprachdaten etablierten Lügen- 
merkmale universell seien, zum anderen sind sie ein wichtiger Hinweis darauf, 
dass auch innerhalb der Einzelsprache der Gebrauch der jeweiligen Elemente al- 
lein schon durch die Regeln des Sprachsystems unterschiedlich geregelt sein 
kann, so dass ein geringeres oder häufigeres Vorkommen nicht dem Effekt des 
Lügens zuzuschreiben ist. Hinzu kommen Konventionen, die situativ, medial 
oder textsortenbedingt den Sprachgebrauch steuern. Im Englischen und Deut- 
schen kann z.B. der Gebrauch von Reflexiv- und Possessivpronomen je nach gram- 
matischem Kontext mal fakultativ und mal obligatorisch sein, und im Deutschen 
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lenkt überwiegend Genus den anaphorischen Gebrauch der Pronomina der drit- 
ten Person. Linguistisch ist es daher wenig überraschend, wenn Masip et al. (vgl. 
2012: 110) ihre Kritik auch unter Hinweis auf die Struktur des Spanischen formu- 
lieren. Da die spanische Verbmorphologie die Person eindeutig bezeichnet, ist 
der Gebrauch der Personalpronomina nur für explizite Betonungen vorgesehen. 

So, wie sich das psychologische Stilkonzept in Wortwahl und Wortfrequenz 
als stilbildenden Merkmalen erschöpft und dem Einzelwort verhaftet ist, so we- 
nig wird den kontextuellen Bedingungen an Einfluss zugeschrieben. Nur so ist 
erklärlich, dass uneindeutige Ergebnisse zu Selbst- und Fremdreferenzen erst im 
Nachhinein u.a. mit dem Gesprächsthema erklärt werden (vgl. Newman et al 2003: 
672), und nur so ist auch nachvollziehbar, dass Bond & Lee (2005: 313) es als vor- 
teilhaft ansehen, „[to] avoid [...] the context-dependence of phrase- or sentence 
level (or greater) language, concentrating instead on the categorization and co- 
ding of individual words used“. Die kontextfreie Analyse der Wortwahl ermögli- 
che so den Zugang zum Denken des Einzelnen: ,,[U]sing methods of word-level 
categorization, provides an indirect examination of what an individual is thin- 
king as he or she communicates“ (ebd.: 314). Im Kontext eines repräsentationis- 
tischen Zeichenbegriffs und eines Referenzbegriffs, der auf die Wortsemantik ab- 
hebt, ist diese Fokussierung auf die lexikalische Ebene bei gleichzeitiger Ver- 
nachlässigung aller Kontextbedingungen stimmig. Die Analyse von Sprache vor 
diesem Hintergrund bleibt dann aber primär der grammatischen Ebene verhaftet. 

Da deswegen jedoch die Bedingungen der jeweiligen Kommunikationssitua- 
tion weitgehend unberücksichtigt bleiben, steht im Raum, dass unzutreffende 
Schlüsse hinsichtlich der Validität bestimmter Liigenmerkmale gezogen werden. 
Gerade das Merkmal der Selbst-Referenz bzw. die PronomenwaHl ist typischer- 
weise kontextuell gebunden (s. Kap. 2.1.2). Bekannt ist auch, dass der Status der 
Gesprächsteilnehmer Einfluss auf die Pronomenwahl nimmt (vgl. DeCock 2016: 
351) und sich auch der Gesprächspartner im Pronomengebrauch dem Sprecher 
anpasst (vgl. Hancock et al. 2008: 19 f.). Des Weiteren macht es einen Unterschied 
im Pronomengebrauch, ob eine Geschichte aus der Beobachter- oder der Hand- 
lungsperspektive erzählt wird (vgl. Tausczik & Pennebaker 2010: 31) und ob der 
Inhalt den Erzähler in ein positives oder negatives Licht rückt (vgl. Hauch 2016: 
69). Die bislang dokumentierten widersprüchlichen Ergebnisse zu Selbst-Refe- 
renzen reflektieren dies unfreiwillig und zeigen nach Meinung Hauchs (vgl. 2016: 
255) umso eindrücklicher, wie sich unabhängige Variablen in unterschiedlicher 
Form mit spezifischen verbalen Lügenindikatoren verbinden. 

Als Folge der bisherigen Überlegungen stellt sich die Frage, ob eine solche 
Auffassung von Sprache und Stil, wie sie die Studien zur Täuschungsforschung 
dokumentieren, dem Ziel, über die Analyse des Sprachgebrauchs Lügner zu iden- 
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tifizieren, grundsätzlich angemessen ist. Unstrittig ist, dass auch der Sprachge- 
brauch unter den Bedingungen des Lügens stilistisch beschrieben werden kann. 
Zweifelhaft ist jedoch, dass seine Ausprägung allein dem Lügen geschuldet ist, 
denn gäbe es einen Stil des Lügens, so müsste es auch einen Stil des „Die-Wahr- 
heit-Sagens“ geben, den zu realisieren Sprechern schwerfallen dürfte, da ihnen 
die Maßstäbe fehlen, nach denen ein solcher Stil sich gestalten würde. Vielmehr 
verhält es sich so, dass mit den Mitteln der Sprache zu täuschen oder die Wahr- 
heit zu sagen Motivationen der Sprecher sind, die sich in bestimmten kommuni- 
kativen Zielen ausdrücken. Zum Erreichen dieser Ziele wenden Sprecher be- 
stimmte Strategien an, mit denen sie bestimmte sprachliche Teilhandlungen rea- 
lisieren, die sich in einem bestimmten Sprachgebrauch niederschlagen. Damit 
stehen die sprachlichen Mittel sozusagen am Endpunkt einer über mehrere Ebe- 
nen realisierten komplexen Sprachhandlung. Brinker spricht denn auch von der 
dienenden Rolle der sprachlichen Elemente, die primär als Trägerstruktur der 
kommunikativen Funktion fungieren (vgl. Brinker 1989: 11 £.). Rückschlüsse auf 
die zugrunde liegende Motivation — das Täuschen - über das Wort können in die- 
sem Sinne, wenn überhaupt, nur sehr indirekt erfolgen. 

Angesichts dieser Unterschiede zwischen Psychologie und Linguistik sollte 
deutlich geworden sein, dass eine kritische Auseinandersetzung mit den linguis- 
tischen Hypothesen zu Sprache und Sprachgebrauch in der Täuschungsforschung 
ebenso sinnvoll wie notwendig ist. Schließlich ist es die fehlende Rezeption lin- 
guistischer Erkenntnisse zum Lügen und zur sprachlichen Täuschung, die sicher 
einen nicht zu unterschätzenden Anteil daran hat, dass die Existenz verbaler Lü- 
genmerkmale auch aktuell (vgl. Hardin 2019: 63) größtenteils recht unkritisch 
postuliert wird und ihr Nachweis als Aufgabe der Psychologie gesehen wird. Ge- 
rade weil die Linguistik als Korrektiv für Annahmen, die dem Untersuchungsge- 
genstand ‚Sprache‘ nicht angemessen sind, fehlt, ist es auch erklärlich, dass man 
glaubt, eine Sprache des Lügens mit den Methoden der Psychologie identifizieren 
und adäquat erforschen zu können. Umso wichtiger ist ein integrierender Ansatz, 
der die Erkenntnisse der Psychologie, der Sprachphilosophie und der Linguistik 
zusammenführt (vgl. Meibauer 2019: 2). Für eine linguistische Analyse von Lü- 
senindikatoren setzt die starke situative Einbettung jeder einzelnen Lüge voraus, 
dass die Analyse der Sprache in direktem Bezug zur jeweiligen Kommunikations- 
situation erfolgt. Im Rahmen einer pragmatisch ausgerichteten Stilanalyse wür- 
den auch möglicherweise auftretenden variierenden Formen von Selbst-Referenz 
dann hinsichtlich ihrer Funktionen im betreffenden Kontext zu untersuchen sein. 
Ob sie sich als stilistische Elemente erweisen, die den Sprachgebrauch der betref- 
fenden Person nicht nur in dieser und anderen Kommunikationssituationen kenn- 
zeichnen, sondern die sich speziell unter den Bedingungen des Lügens in ihrer 
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Ausprägung unterscheiden würden, müsste ebenfalls erst eruiert werden. Auch 
bleibt derzeit völlig offen, ob sich dann ein einzelnes Merkmal wie Selbst-Refe- 
renz tatsächlich als intra- und interpersoneller Lügenindikator identifizieren lie- 
Be. 

Vor diesem Hintergrund sollte das Merkmal der Selbst-Referenz, wie es in der 
psychologischen Täuschungsforschung definiert ist, zum gegenwärtigen Zeit- 
punkt in seiner Funktion als Lügenindikator für anwendungsorientierte linguis- 
tische Analysen (insbesondere mit forensischer Fragestellung) nicht adaptiert wer- 
den. Für linguistische Arbeiten, die mit psychologischen Lügenindikatoren ar- 
beiten, ohne sie auf ihre linguistische Tragfähigkeit hin zu überprüfen, gilt ent- 
sprechend, dass ihre Ergebnisse mit Zurückhaltung zu sehen sind. 


4 Zusammenfassung und Ausblick 


Die vorliegenden Ausführungen haben sich mit linguistischen Aspekten des Merk- 
mals der Selbst-Referenz beschäftigt, das in Teilen der psychologischen Täu- 
schungsforschung als Lügenindikator gilt. Die widersprüchlichen Ergebnisse zu 
diesem Merkmal und die fehlende Reproduzierbarkeit von Ergebnissen verschie- 
dener psychologischer Studien haben verschiedentlich zu dem Schluss geführt, 
dass das Merkmal als solches ungeeignet sei. Die linguistische Betrachtung und 
Analyse der Elemente, ihrer Definition und Kategorisierung sowie die Auseinan- 
dersetzung mit dem zugrunde liegenden Sprach- und Stilbegriff hat jedoch An- 
zeichen dafür erbracht, dass es zu einem guten Teil die zugrundeliegenden An- 
nahmen und Prämissen sind, die zu methodologischen Problemen führen. Dies 
schlägt sich unter anderem in statistisch entweder nicht signifikanten oder in wi- 
dersprüchlichen Ergebnissen nieder. 

Von besonderem Nachteil ist, dass Selbst-Referenz für die Analyse als Lügen- 
indikator weder funktional beschrieben noch in einem pragmatischen Kontext 
betrachtet wird. Dies hat Einfluss auf die Kategorienbildung. Was im Hinblick auf 
die Kategorisierung für die verfolgte Fragestellung nicht angemessen ist, hat in 
der Konsequenz Einfluss auf das Ergebnis der Analyse. Dass sich dem Untersu- 
chungsgegenstand unangemessene Annahmen über Sprache mit einem z.T. sehr 
konkreten Praxisbezug verbinden, stimmt angesichts der Folgen für die Belast- 
barkeit entsprechender Testergebnisse insbesondere mit Blick auf die Strafver- 
folgung nachdenklich. Oft steht mit der Analyse eines inkriminierten Textes, die 
im Zuge polizeilicher Ermittlungen erfolgt, auch die Frage nach seiner Glaubwür- 
digkeit im Raum. So gerne man diese Frage mit linguistischen Mitteln beantwor- 
ten würde, so wenig ist es zum gegenwärtigen Zeitpunkt weder methodisch noch 
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ethisch vertretbar, im Rahmen einer linguistischen Textanalyse entsprechende Be- 
funde als Lügenindikatoren zu interpretieren. 

Die Annahme einer Sprache des Lügens, wie sie über wortbasierte verbale Lü- 
genindikatoren beschrieben wird, steht aus linguistischer Sicht im Widerspruch 
zum Lügen selbst, das ja nur deshalb funktioniert, weil es üblicherweise eben nicht 
an Verhalten und Sprachgebrauch abzulesen ist. Gleichwohl ist der Sprachge- 
brauch des Einzelnen auch in der Situation des Lügens linguistisch von Interesse. 
Anknüpfungspunkte zur Psychologie bestehen deshalb vor allem dort, wo Auto- 
ren Lügen und potentielle verbale Lügenindikatoren verstärkt im Kontext mensch- 
licher Kommunikation und Interaktion betrachten (wie z.B. Burgoon et al. 1999, 
Burgoon 2018). Auch linguistisch gesehen besteht grundsätzlich eine Beziehung 
zwischen dem Lügen und dem Sprachgebrauch, über den der Lügner sein kom- 
munikatives Ziel erreicht. Diese Beziehung sollte jedoch im Rahmen der Pragma- 
tik rekonstruierbar sein (vgl. Meibauer 2019: 6) und ihre Ausarbeitung mit dem 
Instrumentarium der Text- und Gesprächslinguistik vorgenommen werden. Wel- 
che Rolle dabei den sprachlichen Mitteln - und das schließt auch die verbalen 
Lügenindikatoren mit ein - unter der Vielzahl an Faktoren zukommt und wel- 
chen Stellenwert sie schlussendlich haben, muss linguistische Forschung noch 
zeigen. 
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1 Einleitung 


Transfergerüchte im Profifußball, also Gerüchte über Vereinswechsel vertraglich 
gebundener Spieler, sind fester Bestandteil des medialen Fußballdiskurses. Vor 
allem während der sogenannten Wechselperioden in den spielfreien Monaten im 
Sommer und im Winter machen Transfergerüchte einen Großteil der Fußballbe- 
richterstattung aus und werden auch von Fans etwa in Fanzines und Internetfo- 
ren umfassend diskutiert. Bei Gerüchten handelt essich um Kommunikation über 
Unverbiirgtes, an der mit Funktionären, Spielern, Journalist*innen und Fans zahl- 
reiche Akteure beteiligt sind und die professionelle Berichterstattung ebenso um- 
fasst wie informelle internetbasierte Kommunikation. Sie sind deshalb ein ertrag- 
reicher Gegenstand für alle an Medienkommunikation interessierten Disziplinen. 
Und gerade die Gerüchtekommunikation im Internet, die sich anders als die frü- 
her oft über das Hörensagen und somit mündlich verbreiteten Gerüchte im Mo- 
dus der Schrift vollzieht und zeitlich verdauert ist, eröffnet auch methodisch in- 
teressante Perspektiven. 

Im vorliegenden Beitrag möchten wir am Beispiel von Transfergerüchten im 
Profifußball der Männer zeigen, wie zwei disziplinäre Zugänge zur medialen Ge- 
rüchtekommunikation, die publizistisch orientierte Kommunikationswissenschaft 
einerseits und die medienlinguistisch orientierte Korpuslinguistik andererseits, 
einander zu einer integrativen und auf digitale Kommunikationsumgebungen 
zugeschnittenen Gerüchteforschung ergänzen können. Wir gehen von manuel- 
len quantitativen Inhaltsanalysen aus, welche kommunikationswissenschaftliche 
Fragestellungen etwa nach der Einhaltung journalistischer Qualitätsstandards 
bei der Berichterstattung über Gerüchte oder nach den bei der Diskussion über 
die Eintrittswahrscheinlichkeit von Gerüchten verwendeten Argumenten oder Ver- 
weisen auf Medienquellen adressieren (vgl. Vögele 2018a, b). Vor diesem Hinter- 
grund werden wir mit korpuslinguistischen Methoden nach typischen Sprachge- 
brauchsmustern in der Gerüchtekommunikation fragen, welche sich auf rekur- 
rente kommunikative Aufgaben beziehen lassen, die sich in der Kommunikation 
über Unverbiirgtes stellen, wie etwa den Verweis auf Fremdherkunft von Infor- 
mationen oder die Markierung von Unsicherheit. Als gemeinsames Dach beider 
Zugänge wählen wir hierbei den Vergleich zwischen zwei Akteursgruppen, die 
maßgeblich an der Kommunikation über Transfergerüchte beteiligt sind: den 
professionellen Redaktionen einerseits und den Fans andererseits. Wie wir zei- 
gen werden, stellen sich einem solchen Mixed-Methods-Ansatz einige methodo- 
logische Probleme, welche etwa die wechselseitige Übersetzbarkeit zentraler be- 
grifflicher Kategorien oder die Operationalisierung empirischer Parameter be- 
treffen. Doch gerade die disziplinäre Selbstreflexion, welche für den interdiszi- 
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plinären Methoden-Mix Voraussetzung ist, kann dazu beitragen, den gesamten 
Forschungsprozess valider zu gestalten. 

Im Folgenden werden wir zunächst für unseren Zusammenhang einschlä- 
gige Theorien des Gerüchts diskutieren (Kap. 2) und darstellen, an welche über- 
geordneten Fragestellungen sich das kommunikationswissenschaftliche und lin- 
guistische Interesse an Gerüchten anschließen lässt (Kap. 3). Danach werden wir 
unser Datenmaterial vorstellen und das methodische Vorgehen in den Einzeldis- 
ziplinen erläutern (Kap. 4). In zwei Fallstudien möchten wir dann zeigen, welche 
Anschlussstellen sich für einen gewinnbringenden Methoden-Mix ergeben, und 
untersuchen dabei zum einen den Umgang mit Quellen und zum anderen Wahr- 
scheinlichkeitseinschätzungen in der Gerüchtekommunikation (Kap. 5). Abschlie- 
Bend werden wir unser Vorgehen methodologisch reflektieren (Kap. 6). 


2 Theorie(n) des Gerüchts 


Die Gerüchteforschung ist ein interdisziplinäres Forschungsfeld. Vor allem in der 
Psychologie und der Soziologie gibt es zahlreiche theoretische Auseinanderset- 
zungen mit Gerüchten (vgl. z.B. Allport & Postman 1948; Back, Festinger et al. 
1950; Merten 2009; Shibutani 1966). Ein einheitliches Verständnis von Gerüchten 
gibt es aber - schon aufgrund der unterschiedlichen fachspezifischen Zugänge - 
nicht (Kampfer 2008: 8; Merten 2009: 16). Je nach Fachdisziplin stehen unter- 
schiedliche Eigenschaften und Funktionen von Gerüchten im Fokus. Es lassen 
sich aber zumindest zwei zentrale Merkmale des Gerüchts identifizieren, die na- 
hezu allen Definitionen zu Grunde liegen. Das erste Merkmal bezieht sich auf den 
Inhalt des Gerüchts, im Speziellen auf die fehlende Verifikation des Gerüchtein- 
halts. Der Inhalt eines Gerüchts wurde noch nicht überprüft oder konnte noch 
nicht überprüft werden. Die Information ist deshalb unverbürgt (Fleck 2014: 189, 
191; Kirchmann 2004: 72). Das zweite typische Merkmal von Gerüchten betrifft 
ihre Dynamik. Erst durch die Verbreitung wird aus einer singulären Aussage ein 
Gerücht (Fleck 2014: 196; Kirchmann 2004: 79; Merten 2009: 15), und gerade die 
Unverbürstheit trägt dazu bei, dass das dynamische Wesen des Gerüchts erhal- 
ten bleibt (Merten 2009: 25). Über den Wahrheitsgehalt von Gerüchten lässt sich 
diskutieren. Diese fortlaufenden Diskussionen und kollektiven Aushandlungen 
von Plausibilitäten führen dazu, dass das Gerücht im Gespräch bleibt und sich so 
verbreitet. Dies gilt umso mehr, wenn der Inhalt des Gerüchts für die an der Ge- 
rüchtekommunikation Beteiligten von sozialer Relevanz ist. Gerade bei Transfer- 
gerüchten im Fußball, wo der Erfolg der Clubs ganz wesentlich von gelungenen 
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Transfers abhängt, ist das der Fall, insbesondere natürlich für die Fans und des- 
halb auch für die an eben diese Fans adressierte Berichterstattung. 

In der Kommunikationswissenschaft gibt es bislang nur vereinzelt Arbeiten, 
die sich kommunikationstheoretisch mit Gerüchten auseinandersetzen (vgl. z.B. 
Brokoff, Fohrmann, Pompe & Weingart 2008; Bruhn 2004; Bruhn & Wunderlich 
2004; Kampfer 2008; Merten 2009). Im Vordergrund steht dabei jeweils insbeson- 
dere die Frage, welche Rolle die Massenmedien bei der Entstehung und Verbrei- 
tung von Gerüchten einnehmen. Den Massenmedien kommen hierbei vier Haupt- 
funktionen zu. Sie können erstens Gerüchte initiieren, zweitens ihre Verbreitung 
beschleunigen, drittens durch ihre Berichterstattung die Gerüchte validieren und 
ihnen Glaubwürdigkeit verleihen und viertens durch das Berichten über gesi- 
cherte und überprüfte Informationen sowie Dementis auch an ihrer Widerlegung 
mitwirken (Kampfer 2008: 72-74). Die Verschriftlichung des Gerüchts, die in der 
traditionell auf mündliche Gerüchtekommunikation fokussierten Psychologie 
nur eine untergeordnete Rolle spielt (vgl. z.B. Allport & Postman 1948: IX), steht 
hier also besonders im Fokus. 

Gerade durch die Entwicklung digitaler Kommunikationsformen wie der So- 
zialen Medien haben sich nun aber Rahmenbedingungen ergeben, die nicht nur 
die Gerüchtekommunikation selbst verändern, sondern auch neue Fragestellun- 
gen und Untersuchungsmethoden nahelegen. Indem die ehemals mündliche und 
mithin flüchtige Gerüchtekommunikation im Internet verschriftlicht und auch 
dauerhaft gespeichert ist, ist ihre Beobachtung enorm erleichtert (Fleck 2014: 
187, 200; Leggewie & Mertens 2008: 191). Hinzu kommt, dass die digitalen Kom- 
munikationsformen zu einer Beschleunigung und Entgrenzung der Gerüchte- 
kommunikation beitragen (Leggewie & Mertens 2008: 192; Plake, Jansen & Schuh- 
macher 2001: 132) und über Soziale Medien die Nutzer*innen vielfach in die 
verschriftete Gerüchtekommunikation eingebunden sind. Auf diese Weise kön- 
nen neben der Berichterstattung über die Gerüchte auch user-generierte Gerüch- 
tediskussionen analysiert werden (Fleck 2014: 202; Plake, Jansen & Schuhmacher 
2001: 132). War früher die informelle Gerüchtekommunikation allenfalls in expe- 
rimentellen Settings beobachtbar oder über Befragungen rekonstruierbar, kann 
sie hier direkt untersucht werden. In seiner ganz auf die neuen Kommunikations- 
bedingungen zugeschnittenen Theorie des Gerüchts im WWW führt Fleck (2014) 
aus, dass das Gerücht hier „Ausgangspunkt eines reflexiven Prozesses“ (206) ist, 
der zu einem metakommunikativen Klärungsprozess darüber führt, ob der Inhalt 
wahr oder falsch ist. Die Anschlusskommunikation nimmt in Flecks systemtheo- 
retischen Verständnis von Gerüchten deshalb eine zentrale Rolle ein und lässt 
sich gerade in der digitalen Geriichtekommunikation sehr gut beobachten. 
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In der Linguistik hat die Gerüchteforschung dagegen kaum Tradition. In der 
Gesprächsforschung wurden zwar Praktiken wie Klatsch und Tratsch untersucht 
(Bergmann 1988; Fine 1985), jedoch stand vor allem Alltagskommunikation und 
der hierfür typische Klatsch über Personen, die den Interagierenden persönlich 
bekannt sind, im Vordergrund. Allerdings ergeben sich gerade aus dem von Fleck 
beschriebenen Aspekt von Gerüchten, dass sie laufend Anschlusskommunika- 
tion hervorbringen, in denen ihre Unverbürgtheit metakommunikativ adressiert 
wird, interessante Anschlussstellen an linguistische Fragestellungen, und zwar 
im Besonderen vermittels der Kategorien der Evidentialität und Epistemizität. 
Diese wurden vor allem in typologischer und grammatiktheoretischer (Palmer 
1986), in jüngerer Zeit aber auch in medienlinguistischer Perspektive (Sanders 
2012) breit untersucht und bieten auch für die Analyse von Gerüchtekommunika- 
tion eine geeignete Grundlage. Evidentialität als Kennzeichnung der Informati- 
onsquelle und Epistemizität als Faktizitätsbewertung umfassen zahlreiche sprach- 
liche und diskursive Phänomene wie etwa verschiedene Formen der Redewieder- 
gabe oder der Modalisierung, welche sich auch in der Gerüchtekommunikation 
beobachten lassen. Und wie wir unten zeigen werden, kann der an entsprechen- 
den sprachlichen Details interessierte und durch die genannten Theorien des Ge- 
rüchts informierte Blick auf das Textmaterial, die Berichterstattung ebenso wie 
die Fandiskussionen in den Foren, auch den kommunikationswissenschaftlichen 
Blick weiter schärfen. 


3 Übergeordnete Fragestellungen 


Bevor wir uns dem empirischen Material zuwenden, möchten wir zunächst aus 
einer metatheoretischen Perspektive ausführen, in welche übergeordneten Fra- 
gestellungen unser Interesse am Gegenstand der Transfergerüchte jeweils einge- 
bettet ist. Als je fachspezifische und entsprechend grundlagentheoretisch moti- 
vierte Horizonte, welche die theoretischen Anschlussstellen, die Operationalisie- 
rungen und schließlich auch die methodischen Vorgehensweisen präfigurieren, 
prägen sie den Gegenstand entscheidend mit. 

In der Kommunikationswissenschaft, die besonders am Phänomenbereich 
der Massenkommunikation orientiert ist, interessiert bei der Auseinandersetzung 
mit der Berichterstattung über Gerüchte beispielsweise die Frage nach der Ein- 
haltung journalistischer Standards wie der Faktentreue. Außerdem interessiert 
der Vergleich des Umgangs mit Gerüchten durch Journalist*innen, die sich an 
professionellen Standards orientieren, und durch nicht daran gebundene Fans. 
Diese zwei Fragestellungen sollen aus kommunikationswissenschaftlicher Per- 
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spektive in diesem Beitrag im Vordergrund stehen und werden im Folgenden et- 
was detaillierter erklärt. 

Das Besondere an Gerüchten ist, dass sie zu Spekulationen darüber einladen, 
ob die kolportierte Information zutrifft oder nicht, in unserem Fall also, ob der 
Transfer erfolgen wird oder nicht. Diese Vermutungen zur Eintrittswahrschein- 
lichkeit bei Transfergerüchten haben dabei sowohl in der Medienberichterstat- 
tung wie auch in den Fandiskussionen ihren Platz. Aus kommunikationswissen- 
schaftlicher Sicht ist dabei interessant zu analysieren, ob sich diese Einschätz- 
ungen zur Eintrittswahrscheinlichkeit der Transfergerüchte zwischen den Jour- 
nalist*innen und den Fans unterscheiden. Die Journalist*innen treten als profes- 
sionelle Beobachter*innen des Transfermarkts auf. Sie berichten und informie- 
ren über das Geschehen auf dem Transfermarkt, wobei sie auch als aktive Beo- 
bachter*innen auftreten können, wenn sie etwa Spieler oder Vereine mit Trans- 
fergerüchten konfrontieren und dazu befragen und diese Statements dann in ihre 
Berichterstattung einfließen lassen. Dabei ist davon auszugehen, dass sie sich an 
journalistischen Standards orientieren und klassische journalistische Gestal- 
tungsmittel wie das Einbeziehen von O-Tönen beteiligter Akteure oder den Ver- 
weis auf Informationen aus anderen Medienquellen einsetzen (Vögele 2018b: 10, 
298). Die Fans dagegen beobachten den Transfermarkt in ihrer Freizeit. Meist 
sind sie aufgrund ihres Interesses an Fußball und an ihrem Lieblingsclub auch 
an den Aktivitäten auf dem Transfermarkt interessiert (Schäfer & Schäfer-Hock 
2016: 385). Neben der Nutzung der Berichterstattung über Transfergerüchte kön- 
nen die Fans in Sozialen Medien mit anderen Fans über diese Gerüchte diskutie- 
ren und debattieren. Hierbei spielt als Motiv vor allem die Bindung an und die 
Identifikation der Fans mit einem bestimmten Verein eine wichtige Rolle. So ist 
es plausibel anzunehmen, dass sich eine Person, die eine starke emotionale Bin- 
dung an einen Verein hat, auch besonders stark für dessen Aktivitäten auf dem 
Transfermarkt interessiert (Vögele 2018b: 117). Das für die Sportrezeptionsfor- 
schung wichtige Motiv der Identifikation mit Vereinen oder Sportler*innen (Nöl- 
leke & Blöbaum 2012: 166, 171; Schramm 2007: 219) scheint auch bei der Diskus- 
sion von Transfergerüchten durch Fans einen Einfluss zu haben. Die Kommuni- 
kation der Fans über Gerüchte wird deshalb im Vergleich zur Berichterstattung 
voraussichtlich auch stärker aus der Sicht einzelner Vereine, insbesondere der 
Lieblingsvereine der diskutierenden Fans, geführt werden und sie wird stärker 
auf den diskursiven Austausch subjektiver Einschätzungen zu den Transferge- 
rüchten fokussiert sein. In einem inhaltsanalytischen Zugriff auf die Medienbe- 
richterstattung und die Fandiskussionen über Transfergerüchte interessiert des- 
halb, wie Journalist*innen im Vergleich zu Fans die Eintrittswahrscheinlichkei- 
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ten der Transfers einschätzen und auf welche Argumente, Äußerungen von Akt- 
euren oder auch Medien sich Journalist*innen und Fans dabei stützen. 

Aus kommunikationswissenschaftlicher Perspektive stellt sich bei der Be- 
richterstattung über Gerüchte außerdem immer auch die Frage nach der journa- 
listischen Qualität. Bei Gerüchten handelt es sich um noch nicht überprüfte und 
damit ungesicherte Informationen. Dies steht im Widerspruch zu der Forderung 
an den Journalismus, wahrheitsgetreu zu berichten. So formuliert der Deutsche 
Presserat (2015: 3) beispielsweise: „Zur Veröffentlichung bestimmte Informatio- 
nen in Wort, Bild und Grafik sind mit der nach den Umständen gebotenen Sorg- 
falt auf ihren Wahrheitsgehalt zu prüfen und wahrheitsgetreu wiederzugeben.“ 
Die Berichterstattung über Transfergerüchte erfüllt deshalb streng genommen 
das Qualitätskriterium der Faktentreue nicht. Aus diesem Grund ist es im Hin- 
blick auf die Qualität der Berichterstattung von besonderer Bedeutung, wie Jour- 
nalist*innen mit Gerüchten umgehen, ob sie die Gerüchte als solche kennzeich- 
nen und ob sie offenlegen, dass Teile der berichteten Informationen noch nicht 
überprüft und bestätigt sind (Schmalenbach 2012: 365, 367). Besonders wichtig 
ist deshalb als Qualitätsfaktor für die Berichterstattung über Gerüchte die Trans- 
parenz im journalistischen Umgang mit den Gerüchten. In den Medienberichten 
zu Transfergerüchten sollte den Rezipierenden offen kommuniziert werden, dass 
die Informationen Spekulationen sind. Im Pressekodex wird deshalb auch von 
Journalist*innen gefordert, Gerüchte in der Berichterstattung zu kennzeichnen: 
„Unbestätigte Meldungen, Gerüchte und Vermutungen sind als solche erkennbar 
zu machen“ (Deutscher Presserat 2015: 3). Neben der Kennzeichnung der Ge- 
rüchte ist für die Transparenz zusätzlich die Nennung der Quellen der berichteten 
Informationen essentiell. Denn nur dann ist es den Rezipierenden prinzipiell 
möglich einzuschätzen, wie die berichteten Informationen recherchiert wurden, 
und auf dieser Grundlage die Glaubwürdigkeit der Informationen zu bewerten 
(Schmalenbach 2012: 180). Ob diese Transparenz im Umgang mit Gerüchten ge- 
geben ist, soll deshalb mithilfe von Inhaltsanalysen der Medienberichte über- 
prüft werden. 

In der Linguistik interessieren der Maßstab der Faktentreue und andere Qua- 
litätsstandards, die aus kommunikationswissenschaftlicher Perspektive typi- 
scherweise angelegt werden, deutlich weniger. Ob etwa ein redaktioneller Be- 
richt sauber und nachvollziehbar zwischen gesicherten Fakten und Spekulati- 
onen differenziert oder ob objektiv überprüfbare Informationen zur Begründung 
von Einschätzungen herangezogen werden, ist aus linguistischer Perspektive we- 
niger relevant. Die Frage ist eher, mit welchen sprachlichen Mitteln dies jeweils 
geschieht, welche kommunikativen Perspektivierungen (Köller 2004) schon 
durch die Wahl der sprachlichen Mittel möglich werden und wie sie in einzelnen 
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Textsorten und Diskursdomänen mit bestimmten Akteurskonstellationen und 
den entsprechenden Beteiligungsrollen kontextualisiert werden. Der besondere 
Fall der Gerüchtekommunikation im Fußball ist dabei an zwei große Fragenkom- 
plexe anschlussfähig, die in der Medienlinguistik und, in einem erweiterten Sin- 
ne, auch in der Diskurslinguistik diskutiert werden. Zum einen werden unter dem 
Stichwort der Intertextualität Formen und Funktionen expliziter und impliziter 
Bezugnahmen auf andere Texte untersucht (Burger & Luginbühl 2014: 103-120). 
Detailliert und nah am sprachlichen Material werden etwa die mit Zitaten und 
anderen Verweisformen verbundenen Möglichkeiten des Bewertens von Sachver- 
halten oder des subtilen Verschiebens von Verantwortlichkeit für die präsentier- 
ten Informationen nachgezeichnet (Sanders 2012). Zum anderen richtet sich das 
Interesse auf diskursive Bedingungen und sprachliche Verfahren der Herstellung 
von Faktizität (Spitzmüller & Warnke 2011: 46 f.; Felder 2013), die dazu führen, 
dass Äußerungen, die immer perspektivierte Darstellungsweisen sind, als mehr 
oder minder objektiv gerahmt und deshalb auch akzeptiert werden oder eben in 
gezielter Abweichung hiervon als nichtfaktisch, etwa als bloß vermutet, oder 
auch als kontrafaktisch gelten. In empirischen Studien wird dann typischerweise 
korpusbasiert erfasst, welches Formeninventar hierfür in bestimmten Diskursdo- 
mänen zur Verfügung steht, welche Akteure sie wie nutzen und welche Funktio- 
nen die Markierung von (Nicht-)Faktizität hierbei erfüllt (etwa Mattfeldt 2018: 
88-92). Der aus kommunikationswissenschaftlicher Perspektive vorgenommene 
Vergleich der Einschätzungen von Eintrittswahrscheinlichkeiten durch Journa- 
list*innen und Fans wie auch der jeweiligen Rahmung der Gerüchte als bloß kol- 
portierte, ungesicherte Informationen lässt sich also auch linguistisch, d.h. stär- 
ker auf das jeweilige sprachliche Material und seine Funktionalitäten ausgerich- 
tet, reformulieren. 


4 Datenmaterial und methodische Zugänge 


Unsere Analysen stützen sich der akteursvergleichenden Fragestellung entspre- 
chend auf zwei Quellentypen. Zum einen untersuchen wir redaktionelle Online- 
Medienberichte über Transfergerüchte verschiedener Anbieter, also Berichte über 
mögliche Transfers noch vor den offiziellen Bestätigungen oder Dementis. Zum 
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anderen untersuchen wir das Diskussionsforum „Gerüchteküche“ des Online- 
Portals transfermarkt.de.' 

Das Portal transfermarkt.de legt den Schwerpunkt seiner Berichterstattung 
auf Transfers von Fußballspielern und ist eines der reichweitenstärksten Online- 
Angebote zu dieser Thematik. Zusätzlich bietet es verschiedene Online-Foren, in 
denen Fans über Spielerwechsel sowie die beteiligten Spieler und Vereine disku- 
tieren können. Während der Transferperioden im Profifußball im Winter und 
Sommer wird das Portal täglich von circa 1,5 Millionen Fans genutzt (Psotta 2015: 
58). Im Forum „Gerüchteküche“ drehen sich die Diskussionen speziell um die 
Wechsel von Fußballspielern. Registrierte User der Seite haben dort die Möglich- 
keit, Transfergerüchte zu posten, wenn sie auf mindestens eine redaktionelle 
Quelle zum Gerücht verweisen können (Transfermarkt 2016). Pro Transfergerücht 
wird im Forum ein Thread angelegt, in dem die Fans dann unterschiedliche In- 
formationen zu den Gerüchten austauschen, einschlägige Medienberichte zitie- 
ren und über die Eintrittswahrscheinlichkeit diskutieren können. Andere The- 
men sind in den Threads den Forenregeln entsprechend nicht gestattet, weshalb 
die Diskussionen im Vergleich zu anderen Foren thematisch recht kohärent ver- 
laufen. Eine Besonderheit der Gerüchtediskussionen im Kontext von Transferge- 
rüchten besteht außerdem darin, dass spätestens am Ende der Transferperiode 
feststeht, ob das Gerücht der Wahrheit entsprach oder nicht. 

Die Postings in diesem Forum repräsentieren in erster Linie die Diskursbei- 
träge der Fans. Indem dort aber auch aus Medienberichten zitiert wird und diese 
Zitate im Quelltext entsprechend als Zitate ausgezeichnet sind, kann das Forum 
auch als zusätzlicher Fundus an Medienberichten über Transfergerüchte heran- 
gezogen werden. 

Für die jeweiligen methodischen Zugänge wurden die Daten in je unter- 
schiedlicher Weise aufbereitet. Für die kommunikationswissenschaftliche quan- 
titative Inhaltsanalyse wurden aus der Gerüchteküche von transfermarkt.de 200 
Gerüchte zur Sommertransferperiode 2015 zufällig ausgewählt, bei denen min- 
destens einer der betroffenen Vereine in der nachfolgenden Saison 2015/16 Mit- 
glied der ersten Bundesliga war. Zu diesen Gerüchten wurden zum einen je fünf 
zufällig ausgewählte Postings aus der Gerüchteküche erfasst. Zum anderen wur- 
den zu diesen Gerüchten Medienberichte codiert, und zwar die jeweiligen auch 


1 Dass wir uns in unserem Interesse an digitaler Gerüchteforschung gerade mit Transfergerüch- 
ten im Fußball beschäftigen, liegt nicht zuletzt an der überaus ertragreichen Datenlage. In kei- 
nem anderen uns bekannten Bereich lassen sich so detailliert die getrennten, aber aufeinander 
bezogenen Ebenen der redaktionellen Berichterstattung über Gerüchte und der informellen Ge- 
rüchtediskussionen untersuchen. 
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im Forum zitierten Ausgangsnachrichten? sowie weiterführende Berichterstat- 
tung in den fünf Online-Sportmedien kicker.de, transfermarkt.de, spox.com, 
sportbild.de und bild.de/sport. Insgesamt sind 738 Artikel in die Analyse einge- 
gangen. 

Das so zusammengestellte Material bildete dann die Grundlage für quantita- 
tive Inhaltsanalysen. Dabei handelt es sich um „eine empirische Methode zur 
systematischen, intersubjektiv nachvollziehbaren Beschreibung inhaltlicher 
und formaler Merkmale von Mitteilungen, meist mit dem Ziel einer darauf ge- 
stützten interpretativen Inferenz auf mitteilungsexterne Sachverhalte“ (Früh 
2007: 27). In unserem Falle war das Ziel, Merkmale der Berichterstattung sowie 
der Diskussion über Transfergerüchte regelgeleitet zu erfassen und zu identifi- 
zieren, um danach beispielsweise Rückschlüsse ziehen zu können, wie Journa- 
list*innen im Vergleich zu Fans mit den Transfergerüchten umgehen. Hierzu 
wurde ein Kategoriensystem entwickelt, in dem genau aufgelistet ist, welche 
Merkmale in den Texten manuell von Codierer*innen erfasst werden sollen. Bei 
der Bildung des Kategoriensystems wurde im vorliegenden Fall sowohl theorie- 
geleitet und damit deduktiv als auch empiriegeleitet und damit induktiv vorge- 
gangen (Früh 2007: 78-79). Bei der deduktiven Vorgehensweise wurden aus den 
auf der Gerüchteforschung und Ansätzen der Sportkommunikationsforschung 
beruhenden theoretischen Grundlagen der Studie geeignete operationalisier- 
bare Kategorien, die in den Texten erfasst werden sollten, hergeleitet. Um Aus- 
prägungen für diese Kategorien zu finden, wurde das Untersuchungsmaterial 
dann im Anschluss gründlich und umfangreich gesichtet, um daraus geeignete 
Merkmale bezogen auf die Kategorien abzuleiten, die dann im Untersuchungs- 
material identifiziert werden konnten. Bei der Kategorienbildung musste darauf 
geachtet werden, dass die Kategorien trennscharf und exklusiv, also klar zu an- 
deren Kategorien abgrenzbar, und ebenso vollständig sind, also alle möglichen 
Inhalte der Kategorien in den Ausprägungen abdecken (Früh 2007: 87). Um eine 
einheitliche Erfassung der Kategorien durch die Codierer*innen zu ermöglichen, 
wurden ausführliche Codierregeln einschließlich Beispielen in einem Codebuch 
festgehalten, dessen Qualität und einheitliche Anwendung durch die Codierer* 
innen vor der Hauptuntersuchung durch Reliabilitätstests und Messung des In- 
tercoder Agreements sichergestellt wurde (vgl. zu einer Übersicht zum Vorgehen 
bei quantitativen Inhaltsanalysen Rössler 2017 und Früh 2007). 


2 Bei nicht deutsch- oder englischsprachigen Ausgangsnachrichten wurden mithilfe von 
Google Translate Übersetzungen erstellt. 

3 Das Vorgehen ähnelt mithin der auch in der Linguistik üblich gewordenen computergestütz- 
ten Annotation (Alscher & Bender 2016; Bender 2020), insbesondere der semantischen bzw. 
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Bei beiden Codierungen wurde festgehalten, wie die Eintrittswahrscheinlich- 
keit des Transfers von Journalist*innen bzw. Fans eingeschätzt und begründet 
wurde. Unter anderem wurde hierbei erfasst, ob bei der Begründung auf die Aus- 
sagen von Akteuren oder auf Medienquellen Bezug genommen wurde. Bei der 
Analyse der Medienberichte wurde auch codiert, ob die Journalist*innen trans- 
parent mit den Gerüchten umgehen, indem sie diese kennzeichnen und auf die 
Quellen für die Informationen verweisen. Beide Inhaltsanalysen wurden von 
denselben drei Codierer*innen durchgeführt. Die für beide Analysen ermittelten 
Inter-Coder-Reliabilitätswerte legen nahe, dass die drei Codierer*innen das Kate- 
goriensystem ausreichend einheitlich auf die codierten Texte angewandt haben 
(Codierung von 28 Artikeln und 74 Postings, 3 Codierer, Krippendorffs a für alle 
Kategorien zwischen .69 und 1.0). 

Für die korpuslinguistische Analyse wurden einerseits die gleichen Medien- 
berichte wie in der kommunikationswissenschaftlichen Auswertung herangezo- 
gen, wobei hier nur die insgesamt 633 ursprünglich in deutscher Sprache verfass- 
ten Berichte berücksichtigt wurden. Andererseits wurde im Sommer 2018 das ge- 
samte Forum „Gerüchteküche“ von transfermarkt.de heruntergeladen und auf- 
bereitet. Das so erstellte Korpus umfasst 24 179 Threads mit 745 696 Postings. 
Hinzu kommen noch einmal 113 004 Quellenzitate, die jedoch in verschiedenen 
Sprachen verfasst sind und teilweise auch mehrfach von verschiedenen Usern 
eingebracht werden. Deshalb wurde nachbereitend mithilfe eines Spracherken- 
ners‘ ein Korpus erstellt, das nur deutschsprachige Quellenzitate ohne Dubletten 
enthält. Alle Texte wurden mit dem TreeTagger (Schmid 2003) tokenisiert, lem- 
matisiert und nach Wortarten morphosyntaktisch annotiert. Anschließend wur- 
den die Daten in das Korpusanalysetool IMS Corpus Workbench (Evert & CWB 
Dwvelopment Team 2020) geladen. Die folgende Tabelle zeigt die Korpora im 
Überblick: 


Medienberichte Postings Quellenzitate 
Texte 633 745.696 58.493 
Tokens 188.881 50.502.771 4.114.616 


thematischen Annotation und weniger der morphosyntaktischen Annotation etwa nach Wortar- 
ten. Wir kommen unten in Kap. 6 auf diesen Punkt zurück. 

4 Verwendet wurde das freie Perl-Modul Lingua::Identify (https://metacpan.org/pod/Lin- 
gua::Identify). 
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Für den korpuslinguistischen Zugang bieten sich korpusbasierte sowie datenge- 
leitete Ansätze an. Korpusbasiert kann vorgegangen werden, indem ausgehend 
von dem Codierleitfaden, der für die einzelnen Kategorien der Inhaltsanalyse 
auch Beispiele anführt, sowie von den codierten Stichproben sprachliche Auffäl- 
ligkeiten herausgearbeitet und in korpuslinguistische Abfragen überführt wer- 
den. Für die datengeleitete Analyse können außerdem die Korpora in Gänze aus- 
gewertet werden, z.B. durch kontrastive Keywordanalysen. 


5 Zwei Fallstudien 


5.1 Quellen und Evidentialität 


Wie in Kapitel 3 bereits ausgeführt, ist die Berichterstattung über Transferge- 
rüchte problematisch in Bezug auf das journalistische Qualitätskriterium der 
Faktentreue. Deshalb ist aus normativer Sicht zumindest ein transparenter Um- 
gang mit den Gerüchten in der Berichterstattung gefordert, indem diese als Ge- 
rücht gekennzeichnet und die Quellen genannt werden. Die manuelle Analyse 
der Medienberichterstattung zeigt jedoch, dass die Journalist*innen über alle 
analysierten Medienquellen hinweg nur in jedem zehnten Artikel die Gerüchte 
als solche kennzeichnen und damit den Lesenden in den meisten Fällen nicht 
explizit offen legen, dass die berichteten Informationen nicht gesichert sind. 

Die Ausgangsquelle des Gerüchts wird in den Medienbeiträgen in ca. einem 
Fünftel der Artikel genannt (18 %). Auch diesbezüglich weist die Medienbericht- 
erstattung folglich Defizite auf. Die Journalist*innen teilen den Lesenden nur sel- 
ten mit, woher sie die Information zum kolportierten Transfergerücht haben. Auf 
das eigene Medium als Quelle für Informationen verweisen die Journalist*innen 
in den analysierten Medienartikeln in 16 % der Artikel. Hierbei fallen insbeson- 
dere die Artikel von Bild.de auf, da in 40 % dieser die Bild-Zeitung und damit das 
eigene Medium als Quelle genannt wird. Den Journalist*innen der Bild-Zeitung 
scheint es besonders wichtig zu sein, die Leser*innen auf die Rechercheleistun- 
gen ihrer Redaktion hinzuweisen. Insgesamt zeigt die Analyse der Medienbericht- 
erstattung zu den Transfergerüchten jedoch, dass der Umgang mit den Gerüchten 
bezüglich ihrer Kennzeichnung und der Nennung der medialen Ausgangsquelle 
nur wenig transparent ist und hier folglich wichtige journalistische Qualitäts- 
standards nicht beachtet werden. 

Betrachtet man die Medienberichte aus einer linguistischen Perspektive, las- 
sen sich die Befunde aber noch weiter differenzieren. Zwar wird nur in 82 von 633 
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Berichten (13 %) ausdrücklich das Lexem Gerücht verwendet, bei den Quellenzi- 
taten innerhalb des Forums, die (von den Usern selbst gewählte) Ausschnitte aus 
Medienberichten sind, sogar nur in 2 220 von 58 493 (4 %). Ein anderes Bild ergibt 
sich aber, wenn man neben diesen explizit-lexikalischen Kennzeichnungen auch 
erweiterte evidentielle Markierungen berücksichtigt, mit denen auf eine Fremd- 
herkunft der präsentierten Information verwiesen werden kann (Narrog 2012: 11). 
In der Literatur (Smirnova & Diewald 2013: 446-450) wird hier noch unterschie- 
den zwischen quotativen Markierungen wie laut NP [Nominalphrase] (192 Bele- 
ge), welche die Informationsquelle explizit benennen (Bsp. 1), und reportiven 
Markierungen wie dem Modalverb sollen (659 Belege), dem Adjektiv angeblich (65 
Belege) (Bsp. 2), dem Verb gelten als (18 Belege) oder auch der Formel dem Ver- 
nehmen nach (30 Belege), die nur sehr vage zum Ausdruck bringen, dass über- 
haupt auf eine Aussage Dritter rekurriert wird (Bsp. 3 und 4): 

(1) Laut der „Gazzetta dello Sport“ hat der HSV unterdessen Interesse an 
Inter-Mittelfeldspieler Saphir Taider (Marktwert: 6 Millionen Euro). 
(transfermarkt.de, 13.8.2015) 

(2) AS Rom hat angeblich seine Fühler nach Marcel Schmelzer von Borus- 
sia Dortmund ausgestreckt. (spox.com, 19.7.2015) 

(3) Besiktas soll neben Ronny auch ein Auge auf Dzsudzsak geworfen ha- 
ben, der als ausgemachter Wunschspieler von Hertha-Coach Pal Dardai 
gilt. (spox.com, 13.7.2015) 

(4) Knapp sechs Millionen Euro hatte Bayer bislang dem Vernehmen nach 
geboten, um Tah aus seinem bis 2018 laufenden Vertrag raus zu kaufen. 
(spox.com, 13.7.2015) 


Entscheidend hierbei ist, dass durch solche evidentiellen und insbesondere 
durch reportive Markierungen auch die Faktizität des geschilderten Sachverhal- 
tes eingeklammert wird. Die Schreibenden werden nämlich gerade nicht auf die 
Wahrheit der Äußerung festgelegt, wie es in folgenden Umformulierungen der 
Fall wäre: 

(2a) AS Rom hat seine Fühler nach Marcel Schmelzer ausgestreckt. 

(a) Besiktas hat ein Auge auf Dzudzsak geworfen, der ausgemachter 

Wunschspieler von Hertha-Coach Pal Pardai ist. 


Die grundlegende Eigenschaft von Gerüchten, hinsichtlich ihrer Wahrheit bzw. 
Falschheit unentschieden zu sein (Fleck 2014: 191) und zudem bloß kolportierte 
Information zu übermitteln, kann also auch auf diese Weise deutlich gemacht 


5 Die URLs zu allen Belegen einschließlich der Postings sind in Abschnitt Literatur aufgeführt. 
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werden. Eine entsprechende Korpusabfrage nach soll bzw. sollen aber zeigt, dass 
in 364 Medienberichten (58 %) und immerhin 14 446 Quellenzitaten in den Pos- 
tings (25 %) derartige Markierungen zu finden sind, die auch ohne die explizite 
Bezeichnung als Gerücht den unverbürgten Status der präsentierten Informatio- 
nen deutlich machen. Nimmt man noch die anderen genannten evidentiellen 
Markierungen (laut, gilt als, angeblich, dem Vernehmen nach) hinzu, erhöht sich 
der Anteil sogar auf 432 Medienberichte (68 %) und 18 876 Quellenzitate (32 %). 
Aus linguistischer Perspektive, die den Blick auf sprachliche Details lenkt, 
muss der kommunikationswissenschaftliche Befund, dass der Gerüchtestatus 
der präsentierten Informationen nicht offengelegt wird, also relativiert werden. 
Allerdings fällt auf, dass oftmals Formulierungen gewählt werden, welche jen- 
seits einer Fremdherkunft der Informationen überhaupt keine Spezifizierung der 
Quellen erfordern. Der kommunikationswissenschaftliche Befund, dass Journa- 
list*innen nur selten die Herkunft ihrer Informationen klar benennen, lässt sich 
somit auch aus linguistischer Perspektive weiter ausdifferenzieren. Deutlich wird 
das etwa an Formulierungen des Typs wie die Redaktion erfuhr. Woher die Infor- 
mation stammt, kann zwar wie in Bsp. 5 durch Präpositionalphrasen spezifiziert 
werden, bleibt aber dennoch vage und entzieht sich jeder Möglichkeit der Über- 
prüfung: 
(5) Wie die MOPO aus Beraterkreisen erfuhr, denkt der englische Pre- 
mier-League-Klub Newcastle United darüber nach, dem HSV ein Ange- 
bot für Pierre-Michel Lasogga zu unterbreiten. (hsv24.mopo.de, 31.8. 
2015) 


Zudem fällt an derartigen Formulierungen auf, dass sie als passivähnliche Struk- 
turen, welche kasussemantisch gesprochen nur die thematische Rolle des Expe- 
riens besetzen (von Polenz 2008: 170), den eigenen Anteil der Journalist*innen 
an der Weiterverbreitung des Gerüchts ausblenden. Dass diese nicht nur über Ge- 
rüchte schreiben, sondern eben hierdurch an der Verbreitung des Gerüchts und 
mithin auch an ihrem Fortbestehen maßgeblich beteiligt sind, gerät dadurch aus 
dem Blick. Im Hinblick auf die aus kommunikationswissenschaftlicher Sicht ge- 
schilderte Problematik, dass Gerüchteberichterstattung dem journalistischen 
Prinzip der Faktentreue eigentlich nicht entspricht, ist aber gerade das aus der 
Perspektive der Journalist*innen womöglich funktional. Indem das Gerücht ge- 
wissermaßen objektiviert und der konstruktive Eigenanteil am Gerücht ausge- 
blendet wird, können sich Journalist*innen als bloß aufnehmende und neutral 
berichtende, und nicht auch noch das Gerücht selbst vorantreibende Diskurs- 
instanzen inszenieren (Meier-Vieracker 2021). Die Verletzung von Qualitätsstan- 
dards, welche die allzu offensichtliche Verbreitung von Gerüchten darstellen 
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würde, kann auf diesem Wege wenigstens abgeschwächt werden. Nicht nur dass 
die Angabe von Quellen vielfach ausbleibt, sondern auch wie und mit welchen 
kommunikativen Effekten dies geschieht, wird durch eine solche linguistische 
Feinanalyse deutlich und kann auch die Frage nach der Einhaltung von journa- 
listischen Qualitätsstandards in der Gerüchteberichterstattung besser konturie- 
ren. 

In den Gerüchtediskussionen der Fans ist dagegen der Verweis auf Quellen 
schon dadurch grundlegend anders gelagert, dass dies typischerweise durch die 
Quellenzitate geschieht, die im Quelltext und auch visuell durch Einrahmung 
eindeutig markiert sind. Dementsprechend sind in den Postings selbst auch die 
oben erwähnten Evidentialitätsmarker deutlich seltener. Kommen sie in den Me- 
dienberichten rund 5400 mal pro Mio. Wörter und in den Quellenzitaten rund 
6 500 mal pro Mio. Wörter vor, werden sie in den Postings nur rund 1 300 mal pro 
Mio. Wörter verwendet. Und gerade das Modalverb sollen wird hier oft nicht in 
evidentieller, sondern in deontischer Funktion verwendet (etwa in Reisende soll 
man nicht aufhalten oder wer soll das bezahlen). Allerdings herrscht unter den 
Usern schon der Forenregeln wegen die Norm, dass Quellen und auch die Her- 
kunft der Informationen angegeben werden müssen. Die Einhaltung dieser Norm 
wird auch aktiv eingefordert und ein Verstoß wird kommunikativ sanktioniert. 
Dazu sei eine kurze Sequenz aus dem Gerüchtethread „K.P. Boateng zu Borussia 
Dortmund“ zitiert: 

(6) #326 - [...] Bin da aber relativ sicher, dass man das ganze mit AC regelt. 

Mittlerweile wollen Sie ja verkaufen, da Prince nicht verlängern will und 
man gerne noch ablöse einstreichen möchte. Das ganze ist mMn bei 90% 
anzusiedeln. 

#328 - Und das ganze has du woher....? Aus "Insider" Kreisen....? Oder 
habt ihr zufällig die gleiche Glaskugel Zuhause stehen...? Bin mal ge- 
spannt, wie ihr reagiert wenn der Kader fest steht... Und das ganz ohne 
KPB....! Was für'n Zeug raucht ihr eigentlich... 

#330 — Wäre der feine Herr denn so gütig und würde uns seine Quelle 
offenbaren??? 


Auch wenn der User in Post #326 seine Einschätzung durch die Wendungen bin 
mir relativ sicher und mMn [Abkürzung für meiner Meinung nach] deutlich ab- 
schwächt, wird insbesondere im mittleren Teil das Verkaufsvorhaben des AC 
[Mailand] als Faktum und durch die Modalpartikel ja (vgl. hierzu Reineke 2016: 
111) auch als gemeinhin geteiltes Wissen dargestellt. Die Reaktion folgt prompt, 
als der User recht direkt zur Angabe von Quellen aufgefordert und vorgreifend 
eine bloße Berufung auf Insiderkreise - immerhin in Medienberichten kein selten 
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gewähltes Mittel - als nicht ausreichend abgelehnt wird. Auch wenn also Fansin 
ihrem Umgang mit Gerüchten nicht professionellen Standards verpflichtet sind, 
lässt sich gerade in sequentiellen Feinanalysen ein dezidiertes Normenbewusst- 
sein in Bezug auf Quellenangaben nachweisen. 


5.2 Wahrscheinlichkeitseinschätzung und Epistemizität 


Sowohl für die Fandiskussionen wie auch für die Medienberichterstattung wurde 
in der manuellen Inhaltsanalyse erfasst, welche Einschätzungen zur Eintritts- 
wahrscheinlichkeit der Transfers gemacht wurden. Die Journalist*innen schät- 
zen in 97 % der Artikel und dabei folglich fast immer ein, ob der Transfer eintre- 
ten wird oder nicht. Im Vergleich hierzu sind die Fans mit solchen Prognosen 
etwas sparsamer. Sie gehen nur in 39 % der Postings darauf ein, ob der Transfer 
stattfinden wird oder nicht. Während die Journalist*innen die Eintrittswahrschein- 
lichkeit der Transfers dabei überwiegend positiv bewerten, überwiegen bei den 
Fans die negativen Prognosen (Journalist*innen: 56 % positive, 21% ambiva- 
lente, 23% negative Wahrscheinlichkeitseinschätzungen; Fans: 62% negative, 
10 % ambivalente, 28 % positive Wahrscheinlichkeitseinschätzungen). Die Fans 
sind also wesentlich skeptischer bezüglich der Wahrscheinlichkeit der Transfers 
und diskutieren diese kritischer als die Journalist*innen. Hintergrund dieses Un- 
terschieds könnte sein, dass die Journalist*innen nicht daran interessiert sind, 
dem Leser direkt mitzuteilen, dass die von ihnen berichteten Informationen 
höchstwahrscheinlich gar nicht eintreten werden, da sie sonst ihre eigene Be- 
richterstattung unglaubwürdig erscheinen ließen.® 

Codiert wurde in der Inhaltsanalyse auch, ob Fans und Journalist*innen sich 
bei ihren Prognosen zur Begründung auf Aussagen beteiligter Akteure wie z.B. 
von Spielern oder Vereinsverantwortlichen oder auf Informationen aus Medien- 
quellen stützen. Journalist*innen verweisen als Begründung wesentlich häufiger 
auf O-Töne beteiligter Akteure als die Fans (Journalist*innen: 41 %, Fans: 10 %). 
Ebenso greifen Journalist*innen häufiger als die Fans auf Informationen aus Me- 
dienquellen zur Begründung ihrer Prognosen zurück (Journalist*innen: 50 %, 
Fans: 24 %). Wenig überraschend setzen die Journalist*innen folglich klassische 
journalistische Gestaltungsmittel wie das Zitieren von Aussagen beteiligter Ak- 
teure sowie den Verweis auf Informationen aus anderen Medienquellen häufiger 
ein als Fans, denen es stärker um einen Austausch der eigenen Meinungen und 


6 Im Übrigen zeigt ein Vergleich mit den tatsächlich erfolgten Transfers, dass Fans mit ihren 
tendenziell skeptischeren Haltungen häufiger richtig liegen als die Journalist*innen. 
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Einschätzungen zum Transfergerücht geht. In der Berichterstattung und in den 
Fandiskussionen wird dabei vor allem auf Aussagen der Sportdirektoren der an 
den Wechseln beteiligten Clubs verwiesen, da diese üblicherweise in den Verei- 
nen die Verantwortung für Transfers tragen. Sowohl die Fans wie auch die Jour- 
nalist*innen zitieren am häufigsten die Bild-Zeitung als Medienquelle, gefolgt 
vom Kicker. Die Glaubwürdigkeit dieser Quellen wird jedoch dabei nur sehr sel- 
ten eingeschätzt. 

Betrachtet man die inhaltsanalytische Kategorie der Wahrscheinlichkeitsein- 
schätzung aus linguistischer Perspektive, so fällt zunächst auf, dass es hier um 
eher globale Interpretationen der gesamten Artikel und mithin um den Gesamt- 
eindruck geht, der nach der Lektüre der Medienberichte bzw. der Postings zu- 
rückbleibt. Dabei fließen verschiedene Aspekte mit ein wie etwa Äußerungen von 
Personen aus den Vereinen, übereinstimmende Medienberichte, aber auch 
schlüssige Argumentationen etwa hinsichtlich der sportlichen Notwendigkeit ei- 
nes Transfers, die sämtlich eine Kategorisierung als positive Wahrscheinlich- 
keitseinschätzung bedingen. Eine direkte korpuslinguistische Operationalisie- 
rung, die vor allem auch die Polarität positiv/negativ einfangen kann, gestaltet 
sich hier schwierig. Eine mögliche Verbindung bietet jedoch das Konzept der 
Epistemizität, das mit Diewald und Smirnova (2010: 115 f.) bestimmt werden kann 
als „sprecherbasierte Einschätzung des dargestellten Sachverhalts bezüglich sei- 
nes Grades an Realität, Aktualität, Wirklichkeit“. Solange der Spielertransfer, der 
Gegenstand des Gerüchtes ist, nicht offiziell bestätigt oder dementiert ist, muss 
eine solche epistemische Rahmung, von Nuyts (2001: 21 f.) ausdrücklich definiert 
als „estimation of the likelihood that [...] a state of affairs is/has been/will be true 
(or false)“, in irgendeiner Form vorgenommen werden. Denn die Aussagen über 
den Transfer sind in dieser Phase weder wahr noch falsch, sondern eben nur 
mehr oder weniger wahrscheinlich und entsprechend unsicher. 

Wie in der vorangegangenen Fallstudie bereits erläutert, bedingen schon evi- 
dentielle Markierungen wie etwa gilt als typischerweise auch eine epistemische 
Rahmung, indem sie die Schreibenden weniger auf die Faktizität des geschilder- 
ten Sachverhaltes festlegen. Allerdings finden sich in den Daten auch andere e- 
pistemische Markierungen, welche in der Literatur beschrieben sind (etwa Kijko 
2013). Ein Beispiel mag das veranschaulichen: 

(7) In Leverkusen überschlagen sich die Ereignisse! Jetzt berichten spani- 

sche Medien, dass der Werksklub Salzburg-Stürmer Jonathan Soriano 
(29) verpflichten will. Nach BILD-Informationen ist an dem Gerücht tat- 
sächlich was dran: Soriano ist ein Thema, weil Mittelfeld-Allrounder 
Pierre-Emile Höjbjerg (20) nun zu Schalke statt nach Leverkusen wech- 
selt. Vor allem Bayers Ex-Kaderplaner Michael Reschke (jetzt Bayern- 
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Sportdirektor) hatte etwas gegen den Wechsel ins Rheinland. Doch Le- 
verkusen hat schon vorgesorgt und Red Bull-Kapitän Soriano im Visier. 
Doch auch der Wechsel wird nicht einfach: Red Bull ist mit Sicherheit 
nicht begeistert, wenn Leverkusen dann schon ein Bullen-Quartett 
hätte. Denn Soriano wäre im Fall eines Wechsels an den Rhein nach Trai- 
ner Roger Schmidt, Defensiv-Allzweckwaffe Andr& Ramalho, mit Verzö- 
gerung Kevin Kampl bereits der vierte Ex-Salzburger bei Bayer. Ohnehin 
ist Soriano nur einer von mehreren Optionen. (bild.de, 28.8.2015) 


In der kommunikationswissenschaftlichen Analyse wurde dieser Bericht als „am- 
bivalente Wahrscheinlichkeitseinschätzung“ codiert, weil neben der Einschät- 
zung, dass „an dem Gerücht tatsächlich was dran“ sei, auch die Hindernisse ei- 
nes möglichen Wechsels, vor allem das drohende Überangebot erwähnt werden. 
Zusätzlich zu dieser inhaltlich orientierten Analyse fällt aus linguistischer Sicht 
auch das Satzadverbial mit Sicherheit auf, das auf den ersten Blick Gewissheit zu 
markieren scheint, aber im Unterschied zu einer gänzlich ausbleibenden Moda- 
lisierung („Red Bull ist nicht begeistert“) die Aussage klar als Vermutung rahmt. 
Und auch die evidentielle Markierung nach BILD-Informationen schwächt die 
Aussage leicht dahingehend ab, dass die Behauptung über das Zutreffen des Ge- 
rüchts an die aktuelle Quellenlage geknüpft wird. Schließlich ist auch die kon- 
trafaktische Formulierung wäre im Fall eines Wechsels als epistemisch distanzie- 
rend zu beschreiben (Dancygier & Sweetser 2005: 74). 

Weitere epistemische Markierungen in den Medienberichten, mit denen also 
die Faktizität der geschilderten Sachverhalte unter Vorbehalt gestellt wird, sind 
etwa dürfte, wohl und vermutlich, die wie in folgendem Beispiel auch gemeinsam 
auftreten können: 

(8) [...] Und zeitnah dürften die Fans auch Sommer-Einkauf Nummer fünf 
begrüßen können: Andreas Christensen. [...] Spätestens zu Beginn eines 
Trainingslagers wollen Trainer gerne ihre Schützlinge beisammen ha- 
ben, um die neuen Spieler in die Mannschaft zu integrieren. Bei der 
Borussia ist es am Montag soweit, wenn die Fohlen Richtung Rottach- 
Egern am Tegernsee aufbrechen. Doch Christensen wird wohl schon frü- 
her zu seinen neuen Teamkollegen stoßen, vermutlich sogar am morgi- 
gen Freitag. (kicker.de, 9.7.2015) 


Bei näherer Betrachtung zeigt sich, dass die linguistische Kategorie der Epistemi- 
zität mit den zugehörigen sprachlichen Mitteln im Vergleich zur kommunikati- 
onswissenschaftlichen Kategorie der Wahrscheinlichkeitseinschätzung eine Stu- 
fe abstrakter ist. Epistemizität meintim Wesentlichen, dass ein Sachverhalt über- 
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haupt als nicht objektiv gegeben, sondern eben als bloß wahrscheinlich darge- 
stellt wird. Ob aber das Eintreten des jeweiligen Transfers wahrscheinlicher ist 
als sein Ausbleiben, ist nicht mehr Sache der epistemischen Rahmung als sol- 
cher, sondern des Sachverhalts selbst.’ 

Aus sprachtheoretischer Perspektive ist nun erwähnenswert, dass epistemi- 
sche Rahmung immer eine gewisse Subjektivität ins Spiel bringt, da ein Sachver- 
halt immer aus jemandes Perspektive als wahrscheinlich erscheint. Da aber Jour- 
nalist*innen gehalten sind, in informationsorientierten Textsorten wie Berichten 
auf allzu subjektive Einschätzungen zu verzichten, bringen sie eher selten ihre 
persönliche Perspektive ein, sondern treten vielmehr - in Einklang mit den Be- 
funden der vorangehenden Fallstudie - als Sprachrohre in Erscheinung. Symp- 
tomatisch ist in diesem Zusammenhang die Formulierung gilt als wahrscheinlich: 

(9) Es gilt als wahrscheinlich, dass die Verhandlungen mit dem Erfolgs- 

coach schon in Kürze abgeschlossen werden. (kicker.de, 19.7.2015) 
(10) Robbens Vertrag bei den Bayern läuft noch bis 2017. Ein Verkauf in die- 
sem Sommer gilt als eher unwahrscheinlich. (sportbild.de, 28.8.2015) 


Durch die hier bloß referierte Wahrscheinlichkeitseinschätzung wird sprachlich 
eine — wenn auch nicht näher bestimmte — Fremdperspektive eingebracht und 
dadurch die Subjektivität der Einschätzung abgefangen. Auch mit dem kommu- 
nikationswissenschaftlichen Befund, dass Journalist*innen bei der Begründung 
ihrer Wahrscheinlichkeitseinschätzungen auf Gestaltungsmittel wie Zitate von 
Akteuren wie auch von anderen Medienquellen setzen, ist diese Beobachtung 
verträglich. Nochmals deutlicher wird es darum auch bei den vielen Fällen, in 
denen die Einschätzung der Wahrscheinlichkeit ganz den Akteuren überlassen 
wird: 
(11) „Es ist wahrscheinlicher, dass der Wechsel über die Bühne geht, als an- 
dersherum“, sagte Sportdirektor Jens Todt am Donnerstag. (transfer- 
markt.de, 13.8.2015) 


Die kommunikationswissenschaftliche Analyse hat zudem ergeben, dass Fans in 
den Gerüchtediskussionen im Diskussionsforum „Gerüchteküche“ deutlich stär- 
ker aus einer subjektiven Perspektive heraus argumentieren. Aus linguistischer 
Sicht ist deshalb zu erwarten, dass auch die epistemischen Rahmungen, die ins- 


7 Dies lässt sich an folgendem konstruierten Beispiel veranschaulichen: Der Transfer wird wohl 
klappen / platzen. Die Partikel wohl markiert überhaupt die Wahrscheinlichkeit i. Ggs. zu Fakti- 
zität, die Verben klappen / platzen dagegen, ob eher das Eintreten oder das Ausbleiben wahr- 
scheinlich ist. 
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gesamt Subjektivität sprachlich verankern, in den Postings häufiger sind als in 
den Medienberichten. Eine Möglichkeit, dieser Hypothese datengeleitet nachzu- 
gehen, ist die Berechnung von Keywords. Dabei werden die vollständigen Da- 
tensätze der Medienberichte sowie der Postings miteinander kontrastiert und sig- 
nifikant häufige Lexeme berechnet, die mithin als typisch für das jeweilige Kor- 
pus gelten können (Culpeper & Demmen 2015). Die folgende Abbildung zeigt die 
100 signifikantesten Keywords, wobei der Keyness-Wert (Log Likelihood Ratio) 
in der Schriftgröße repräsentiert wird:® 


ich man nicht Ja wenn er da das 


dann auch mal kann was so mir würde 


oder du wäre denke ihn aber sollte wirklich ist 
schon hier es einfach wird und sehe eher doch nur denn 
wie ein sicher glaube ne mich mehr eben sicherlich 


Spieler als sehr dass hat gut halt CL viel Mio finde dir wohl 
Geld halte Meinung euch Quelle bitte leider vorstellen nen recht vielleicht 
warum Liga eigentlich hast Gerücht weil spielen mMn besser Sinn also 
ihm hätte naja natürlich holen richtig eh sie gar nochmal hab jemand jetzt 
ob überhaupt gute gesehen wir echt bekommen bestimmt hoffe 


Abbildung 1: Top 100 Keywords Postings vs. Medienberichte (LLR) 


Tatsächlich erweisen sich insbesondere solche Ausdrücke als typisch für die Pos- 
tings, die der ganz subjektiven Einschätzung der Medienberichte und der dort 
getätigten Aussagen dienen, auf die die Postings jeweils reagieren. Wendungen 
wie ich denke / glaube / hoffe, die oft vergleichbar zu Hedges wie meiner Meinung 
nach / mMn verwendet werden, sind hier ebenso zu nennen wie die Modaladver- 
bien wirklich, sicherlich, leider, vielleicht und natürlich. Auch die epistemizitäts- 
markierenden Modalpartikeln ja, eben, halt, wohl (Averina 2019) fallen auf, dazu 
noch die Verben im Konjunktiv II würde und wäre, welche typischerweise in kont- 
rafaktischen Konditionalen Verwendung finden. Prominent ist schließlich auch 


8 Aufeine Präsentation der Keywords der Postings im Vergleich zu den in den Postings enthal- 
tenen Quellenzitaten wird hier aus Platzgründen verzichtet, sie decken sich aber in weiten Tei- 
len. 
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das Kognitionsverb vorstellen, das vor allem in der Wendung kann ich mir (nicht) 
vorstellen vorkommt. Zwar mag ein Teil der Keywords auch dem für Internetforen 
charakteristischen konzeptionell mündlichen Register geschuldet sein. Dennoch 
liegt der Schluss nahe, dass die User in ihren Postings ganz explizit ihre eigene 
Haltung zu den Gerüchten thematisieren. Die Eintrittswahrscheinlichkeit der 
Transfers versuchen sie nicht allein durch Verweis auf Quellen und recherchierte 
Fakten zu stützen, sondern sie spielen auch die potentiellen Nutzen und Risiken 
durch und beurteilen aus einer ganz subjektiven Perspektive die Plausibilität des 
Gerüchts. Ein besonders typisches Beispiel: 

(12) Wenn Martial wirklich eine Option für München wäre, wird man si- 
cher den Deal mit ManU. bezüglich Vidal eingehen da ja Goretzka schon 
fix da ist. Auch könnte ich mir da noch Can vorstellen das er kommt 
wenn Vidal wirklich gehen sollte. Der Tausch mit einer kleinen Aufzah- 
lung wäre ok für mich und würde auch gut passen, das sollte man sich 
nicht entgehen lassen. 


Ausdrückliche Thematisierungen der Wahrscheinlichkeit, die in den Medienbe- 
richten wie oben erläutert tendenziell nur referiert werden, werden in den Pos- 
tings dagegen aus ganz subjektiver Perspektive vorgetragen: 

(13) Halte ich für wahrscheinlich. Der Markt mit Offensivspielern ist nicht 
übervoll, Rüter sitzt beim KFC maximal auf der Tribüne und kam schon 
letzte Saison kaum zum Einsatz! Ich denke, dass die Zeichen hier auf 
Trennung stehen und Rüter sich einen guten Club in der RL sucht, wo 
auch die nötigen finanziellen Mittel vorhanden sind und der Ambitionen 
auf den Aufstieg hat... Denke, das sind über 50%)! 


Mit dem Verweis auf die Marktsituation liefert der User zwar objektiv nachvoll- 
ziehbare Gründe für seine Einschätzung, dennoch wird diese durch die Wendung 
halte ich für wahrscheinlich wie auch durch die doppelte Markierung mit (ich) 
denke als persönliche Einschätzung vorgetragen. 

Die metakommunikative Adressierung, die Fleck (2014) für Gerüchtekommu- 
nikation im Netz beschrieben hat und durch die das Gerücht eben nicht unreflek- 
tiert aufgenommen, sondern gerade in seiner Unverbürgtheit thematisiert wird, 
zeigt sich in solchen dichten Netzen von epistemischen Rahmungen jedenfalls 
besonders deutlich. Ausführlich und vor allem im dialogischen Austausch mit 
anderen Usern wird das Gerücht in seiner Überzeugungskraft für ein ganz partei- 
isches Publikum erwogen und auf seine Plausibilität hin geprüft. Zusätzlich zu 
der kommunikationswissenschaftlichen Analyse, welche vor allem auf die inhalt- 
lich zu erfassende, positive oder negative Einschätzung der Eintrittswahrschein- 
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lichkeit abzielte, kann die am Begriff der Epistemizität orientierte linguistische 
Feinanalyse deshalb zeigen, wie auch sprachliche Oberflächenmerkmale dazu 
beitragen, die Gerüchtekommunikation überhaupt als Reden über Wahrschein- 
lichkeiten statt über erwiesene Tatsachen zu rahmen. 


6 Metareflexion des Method Mixing 


Die beiden Fallstudien haben gezeigt, dass die methodischen Ansätze der kom- 
munikationswissenschaftlichen Inhaltsanalyse und der korpuslinguistisch vor- 
gehenden Medienlinguistik einander in verschiedener Hinsicht ergänzen können. 
Ausgehend von den Beispielen im Codierleitfaden wie auch den jeweils codierten 
Stichproben können linguistische Operationalisierungen für gezielte Korpusab- 
fragen vorgenommen und somit auf weit größere Datenmengen übertragen wer- 
den. Darüber hinaus erlaubt der linguistisch geschulte Blick auf sprachliche De- 
tails differenziertere Urteile über die typischen Praktiken der Gerüchtekommu- 
nikation, die wir mit Fleck (2014) als metakommunikative Adressierungen von 
Unverbürgtheit bestimmt haben. Diese Praktiken sind schließlich immer auch 
sprachlich verankert und werden auch dann über sprachliche Merkmale identifi- 
ziert, wenn sich der analytische Blick auf inhaltliche Aspekte richtet. Wie wir am 
Beispiel von Evidentialitätsmarkierungen zeigen konnten, kann eine linguistische 
Feinanalyse, welche auch die impliziten Formen der Kennzeichnung von Gerüch- 
ten als bloß kolportierten Informationen berücksichtigt, die kommunikationswis- 
senschaftlichen Kategorien noch weiter schärfen. Und am Beispiel von Epistemi- 
zitätsmarkierungen konnten wir zeigen, dass den positiven oder negativen Wahr- 
scheinlichkeitseinschätzungen, wie sie in der Inhaltsanalyse codiert werden, epis- 
temische Rahmungen vorgelagert sind, die überhaupt die Nichtfaktizität der Re- 
degegenstände markieren und - besonders auf Seiten der Fans - für subjektive 
Bewertungen zugänglich machen. 

Die linguistischen, aber durch die Anknüpfung an kommunikationswissen- 
schaftliche Theorien des Gerüchts interdisziplinär fundierten Befunde über die 
sprachlichen Muster in der Gerüchtekommunikation könnten unseres Erachtens 
auch auf die kommunikationswissenschaftliche Inhaltsanalyse rückübertragen 
werden. Für zukünftige Forschungen wäre zu empfehlen, die Kommunikations- 
wissenschaft von Beginn an durch korpuslinguistische Verfahren bei der induk- 
tiven Kategorienbildung wie auch bei der Formulierung der Codierregeln zu un- 
terstützen, indem auf breiter Datenbasis sprachliche Muster und ihre Verteilun- 
gen identifiziert und in Beispielen erläutert werden. Auch die linguistisch fun- 
dierten Hypothesen über mögliche Effekte dieser sprachlichen Muster (etwa der 
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perspektivierenden Ausblendung des Eigenanteils der Journalist*innen an der 
fortgesetzten Gerüchtekommunikation) können im Codebuch an Beispielen er- 
läutert und somit der ganze Codierungsprozess valider und reliabler gestaltet 
werden.? 

Ein solcher Mixed-Methods-Ansatz, durch den beide Seiten von der jeweils 
anderen profitieren, ist jedoch mit grundlegenden Herausforderungen verbun- 
den. Die durchaus differierenden Terminologien und Begriffe, aber auch die über- 
geordneten disziplinären Fragestellungen, die mit der Analyse des gewählten Ge- 
genstands adressiert werden, müssen zunächst wechselseitig erläutert werden, 
um transdisziplinäre Fehldeutungen zu vermeiden. In unserem Falle musste erst 
ein einheitliches Verständnis von Gerüchten, das für beide Fachdisziplinen, ihre 
Fragestellungen und ihre Methoden zugänglich ist, gefunden werden. Auch das 
in der kommunikationswissenschaftlichen Analyse grundlegende Konzept der 
Wahrscheinlichkeitseinschätzung, das vorderhand mit Epistemizität im linguis- 
tischen Sinne kompatibel zu sein scheint, erweist sich als durchaus verschieden. 

Besonders deutlich wird die Differenz beider disziplinärer Perspektiven im 
Übrigen schon am Begriff des Inhalts. Die für die kommunikationswissenschaft- 
liche Perspektive leitende Maxime, dass weniger die sprachliche Form der Äuße- 
rungen, sondern ihr Inhalt interessiert, ist kaum mit der linguistischen Grundan- 
nahme verträglich, dass gerade die sprachliche Form den Inhalt immer schon 
prägt - sei es durch lexikalische Wahlen, durch grammatisch-syntaktisch be- 
dingte Perspektivierungen oder auch durch stilistische Markierungen. Da auch 
Inhalt immer sprachlich ausgedrückt werden muss und Sprache in ihrer Perfor- 
manz Eigensinn erzeugt (Jäger 2015: 113), erscheint aus linguistischer Sicht der 
Fokus auf einen von der sprachlichen Form unabhängigen Inhalt kaum haltbar. 
Die Inhaltsanalyse, so lässt sich dies in Anlehnung an Frühs (2007: 27) Formulie- 
rung der „interpretativen Inferenz“ vielleicht auflösen, setzt viel stärker auf schluss- 
folgernde Deutungen der analysierten Texte, als die Metapher des Inhalts (Reddy 
1993) vermuten lässt. Dies gilt umso mehr, als der eigentlichen Analyse eine so- 
wohl deduktiv-theoriegeleitete als auch induktiv-empiriegeleitete Kategorienbil- 
dung vorangegangen ist, in die vielschichtige interpretatorische Schritte einge- 
hen. Die linguistische Analyse kann hier transparent machen, welche sprach- 
lichen Merkmale bestimmte Deutungen erst evozieren. Die Korpuslinguistik mit 


9 Neue methodologische Ansätze zur linguistischen Annotation weisen im Übrigen in eine ähn- 
liche Richtung, indem sie für die induktive Ausarbeitung der Kategoriensysteme, welche der An- 
notationspraxis zugrunde liegen, explizit sprachliche und mithin korpuslinguistisch operatio- 
nalisierbare Merkmale als Indikatoren für die Kategorien ansetzen und dies auch in den Annota- 
tionsrichtlinien vermerken (Bender 2020: 3). 
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ihrem klaren Fokus auf die Sprachoberfläche steht dagegen ihrerseits vor dem 
Problem, zwar objektivier- und replizierbare Ergebnisse zu liefern, die aber auch 
erst interpretiert werden müssen, um für weiterführende Fragen, etwa nach den 
Funktionen der gefundenen sprachlichen Mittel in der Gerüchtekommunikation, 
anschlussfähig zu sein (Scharloth 2018: 67). Hierbei können die kommunikati- 
onswissenschaftlichen Theorien und Konzepte der Gerüchteforschung hilfreich 
sein. Die Anschlussstellen zwischen beiden Zugängen und Perspektiven sind des- 
halb nicht von vornherein gegeben, sondern müssen immer erst noch hergestellt 
werden. 

Im Rückblick auf unseren interdisziplinären Brückenschlag sehen wir aber 
gerade in diesen Herausforderungen eines Mixed-Methods-Ansatzes auch sein be- 
sonderes Potenzial. Gerade die Unterschiede in den Konzeptualisierungen und 
Herangehensweisen waren Anlass, das Besondere der jeweiligen Fachdisziplinen, 
ihrer Fragestellungen und ihrer Grundbegriffe zu explizieren und dadurch den 
jeweils eigenen Zugang auch noch einmal grundlegend zu überdenken. Gerade 
in der Schwierigkeit des Vollzugs verspricht ein Methoden-Mix nicht nur, die 
Stärken beider Zugänge für ein besseres Verständnis des Gegenstandes zu ver- 
binden. Er lässt uns auch die Eigenschaften, Leistungen und auch Beschränkun- 
gen des jeweils eigenen Zugangs besser verstehen. 
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Abstract: Der Artikel geht der Frage nach, warum Praxisakteure kaum in die Dis- 
kursanalysen involviert werden. Angesichts der abstrakt bleibenden Akteursbe- 
sriffe in der Diskurslinguistik wird eine Operationalisierung von ‚Akteur‘ vorge- 
schlagen, um Akteure als Praxispartner und als Untersuchungsgegenstände er- 
fassen zu können. Ausgangspunkt ist die angewandte Diskurslinguistik, die zeigt, 
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Beispiel eines transdisziplinären Forschungsprojets zu Energiediskursen gezeigt. 
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1 Zur Notwendigkeit der Operationalisierung von 
‚Akteur‘ - ein Problemaufriss 


1.1 Hinführung 


In der professionellen Kommunikationspraxis sind Äußerungen der folgenden 
Art nicht selten anzutreffen: Wir haben es mit unserer Kommunikation geschafft!; 
Wir sollten rasch entscheiden, um das Problem zu lösen ..!; Die Konkurrenz macht 
es besser als wir ..! Dabei stellt sich bei näherem Hinsehen die Frage, wer ‚wir‘ 
eigentlich genau sind, und wie diesem ‚wir‘ eine Handlungsmacht zugeschrieben 
werden kann, wenn es sich in der Realität doch aus eigenständigen Individuen 
mit unterschiedlichen Handlungsspielräumen zusammensetzt. Es ist offensicht- 
lich, dass die westliche Moderne den Fokus besonders auf das selbstbewusste 
‚Ich‘ oder ‚Wir‘ richtet, weil sie die Vorstellung einer ‚göttlichen Bestimmung‘ ab- 
lehnt und den Menschen in der Rolle sieht, sein Handeln zum Guten oder zum 
Schlechten wenden zu können. Allerdings bleibt diese Sichtweise nicht unbe- 
stritten: Neben anderen hat die Theorie der „reflexiven Moderne“ (Beck, Giddens 
& Lash 2014) beobachtet, dass Organisationen - und dies als Reaktion auf die 
Komplexität ihrer Umwelt - die kritische Reflexion über Selbstbezüglichkeit för- 
dern und institutionalisieren können (vgl. Giddens 1997: 38). Hier setzt auch die 
angewandte Diskurslinguistik an (Dreesen & Stücheli-Herlach 2019). Sie unter- 
sucht Sprachgebrauch in lebensweltlichen Kontexten, um Beiträge zu Hand- 
lungsproblemen zu leisten, die für Gemeinschaften und Gesellschaften relevant 
sind. Entsprechend ist es für sie unumgänglich, den Gebrauch der ersten Person 
in Diskursen der organisierten Praxis empirisch zu untersuchen sowie theore- 
tisch und methodisch zu reflektieren. 

Die Diskursforschung setzt üblicherweise nicht (personal-)deiktisch beim Ich 
oder beim Wir an, wenn sie Muster des Sprachgebrauchs (vgl. Bubenhofer 2009) 
untersucht. Dies mag unterschiedliche Gründe haben, ist im Wesentlichen aber 
auf eine zentrale Prämisse zurückzuführen: Die Diskurstheorie in starker Anleh- 
nung an Foucault versteht Aussagen und Kommunikationsregeln als Manifesta- 
tionen eines Weltwissens, das nicht auf verantwortliche Urheber oder Autoren 
zurückzuführen ist (vgl. Foucault 2001). Andersherum betrachtet - aber im glei- 
chen diskurstheoretischen Paradigma - gibt es personale und organisationale 
Akteure, die sich zwar äussern, aber im Diskurs nicht wahrgenommen werden 
können. Indem sich die Diskursforschung von den Vorstellungen einer ‚spre- 
chenden Instanz‘ und eines ‚Gesagten‘ löst, stellt sie traditionelle pragmalingu- 
istische Überzeugungen infrage. Notwendigerweise musste in der Diskurslingu- 
istik - und zumal in der angewandten Diskurslinguistik — die Diskussion über die 
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Kategorie ‚Akteur‘ angestossen werden (Dreesen & Stücheli-Herlach 2019: 129- 
131), um deren theoretische und methodische Zugänge zu schärfen und zu vertie- 
fen. Eine solche diskurslinguistische Kategorie würde mindestens die folgenden 
drei Reflexionsschritte ermöglichen und etablieren. 

Erstens: ‚Akteur‘ kann als diskursive Ausprägung der Rede von Menschen 
und Institutionen verstanden werden, etwa um sprachliche Bezeichnungen von 
personalen (Donald Trump) oder kollektiven Akteuren (die Amerikaner) vorzu- 
nehmen (vgl. etwa Spitzmüller & Warnke 2011: 141-142, 193). Zweitens: Bei dieser 
Sichtweise bleibt die diskurstheoretische Spannung zwischen der Intention von 
Gesagtem auf der einen Seite (ich bin mir bewusst, was ich sage) und dessen Prä- 
gung durch den Diskurs auf der anderen Seite (man sagt das so) erhalten. Der 
wichtige und dritte Punkt ist, dass die Entscheidung darüber, was jemand wie 
meint und insofern sprachlich handelt, nach den Regeln des Diskurses vollzogen 
wird: Indem personale Akteure (bspw. ein Ich), auch artifizielle (bspw. ein Com- 
puter) und kollektive Akteure (bspw. die Firma, die Märkte) durch diskursive 
Praktiken miteinander verknüpft werden (bspw. Ich helfe mit, dass die Computer 
dieser Firma die Märkte aufrollen), also sich gegenseitig (be-)nennen oder zitie- 
ren, schreiben sie sich Entscheidungs- und eventuell Handlungsmacht zu (vgl. 
Taylor & Cooren 1997; Taylor & van Every 2010: 25-37); ihnen werden dadurch 
Positionen im Diskurs zugeschrieben bzw. zugesprochen, sie werden ‚autorisiert‘ 
(vgl. Kapitel 2.2.3). 

Sowohl das umgangssprachlich-selbstbezügliche wie das voraussetzungs- 
voll reflektierte Akteursverständnis werden in der diskurslinguistischen For- 
schungskooperation mit Praxispartnern (und damit mit personalen wie kollek- 
tiven Diskursakteuren) problematisch: Diskurswissenschaftliche Erkenntnisse 
widersprechen dem selbstbezüglichen, lebensweltlichen Verständnis; einge- 
schliffene Selbstbilder der Praxis widersprechen hingegen dem reflektierten, wis- 
senschaftlichen Verständnis. Will Diskursforschung an Relevanz für die Kommu- 
nikationspraxis gewinnen - was seit längerem zu ihren Ambitionen gehört (vgl. 
Del Percio & Reisigl 2014) -, dann wird die Reflexion über die Voraussetzungen 
und Möglichkeiten eines Akteurskonzepts unausweichlich. Das bedeutet zu kon- 
statieren, dass eine „ausführliche Diskussion darüber, inwiefern sich dieser sozi- 
ologisch geprägte Terminus auf die Linguistik übertragen lässt“, noch aussteht 
(Müller 2018: 37). Müller befindet hier aus „linguistischer Perspektive zwangsläu- 
fig eine gewisse Grobkörnigkeit bei der Beschreibung der Produktionsverhält- 
nisse von Sprache“ (38). Eine systematische Operationalisierung des Akteurskon- 
zepts mit linguistischen Mitteln ist dabei nach wie vor ein Desiderat, dessen Be- 
arbeitung sich indes lohnen könnte. Denn gerade das Akteurskonzept erlaubt es, 
sich mit sozial- und sprachwissenschaftlichen, epistemologischen und ethischen, 
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sprach-, organisations- und gesellschaftskritischen Fragestellungen zu beschäf- 
tigen, die gerade eine Stärke diskursanalytischen und anwendungsorientierten 
Forschens sind. 

Diskursakteure kennen die sie betreffenden Diskurse (habitualisierte Arran- 
gements von Mustern des Sprachgebrauchs in Debatten, zu Themen, zu Ereignis- 
sen, zu Akteuren etc.) in der Regel besser als Forschende, die sich in ein Diskurs- 
thema immer erst einarbeiten müssen. Es stellt sich die Frage, warum betroffene 
und involvierte Akteure aber kaum je direkt und ausführlich befragt werden, um 
Diskurse besser zu verstehen und mitunter — unter Anwendung von Ockhams Ra- 
siermesser - naheliegende Erklärungen für beobachtbaren Sprachgebrauch (und 
weitere Hinweise auf diskursive Akteurshandlungen) zu erhalten. Setzt man sich 
mit den Handlungskonzepten der mittlerweile zahlreichen (deskriptiven) lingu- 
istischen Analysen aktueller Diskurse auseinander, erkennt man Hinweise auf 
Vorstellungen von aufklärerischen Analysezwecken und zivilgesellschaftlichem 
‚Empowerment‘ (exemplarisch: Vogel 2012: 286-294; Wallis 2016; Tereick 2016, 
26-27, 368). Viele Ansätze der angewandten Diskursforschung (z.B. im Bereich 
Medizin) und der Kritischen Diskursanalyse/CDA (z.B. des Feminismus) adressie- 
ren ohnehin professionelle und gesellschaftliche Akteure (vgl. Del Percio & Rei- 
sigl 2014). Deshalb ist nicht davon auszugehen, dass die zugrundeliegenden Ak- 
teurskonzepte ein aktives Zugehen auf die Diskursakteure grundsätzlich verhin- 
dern würden. Gleichwohl bleibt wohl die Feststellung richtig, die „Abstraktion 
vom sprachlichen Akteur“ führe zur Blockade einer angewandten Diskurslingu- 
istik (Roth & Spiegel 2013: 9). 

Professionelle Diskursakteure wie politische Organisationen, internationale 
NGOs und Wirtschaftskonzerne (sowie ihre personalen Aktanten) verfügen über 
ein höheres Mass an Analyse- und Reflexionsfähigkeiten, als dies vonseiten der 
sprachbezogenen Diskursforschung häufig angenommen wird. Dieses Potenzial 
kann für eine anwendungsorientierte („transdisziplinäre“, s.u.) Forschung ge- 
nutzt werden. Zudem: Im Zuge der Datafizierung weiter Teile der Kommunikati- 
onspraxis sind datengestützte (Sprach-)Analysen und wissenschaftliche Sprach- 
gebrauchsberatung noch wichtiger und nützlicher geworden für die Organisati- 
onspraxis in der ‚reflexiven Moderne‘. Voraussetzung für die Nutzung dieser Po- 
tenziale ist allerdings die Überbrückung von Hürden der Verständigung über das 
Akteurskonzept. 

Ein erster Schritt zur Überbrückung dieser Hürden kann von der Diskursfor- 
schung selbst vollzogen werden. Denn es scheint, als operierten professionelle 
Diskursanalysen bisweilen mit zwei Akteurskonzepten (ähnlich argumentiert La- 
tour 2004: 237-241 für die Soziologie): Einerseits wird ein tendenziell ‚schwacher‘ 
Akteur als Untersuchungsobjekt angenommen, der bisweilen wie eine Marionet- 
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te von unsichtbaren diskursiven Fäden bewegt wird; andererseits wird in Koope- 
rationen davon ausgegangen, dass es sich bei den Diskursakteuren in der Regel 
um kompetente, verantwortliche und reflektierte Personen handelt (vgl. Dreesen 
& Stücheli-Herlach 2019: 129-131). Dieses Spannungsfeld (mit Fokus auf diskur- 
sive Macht diskutiert bei Grillo 2005) kann indes produktiv genutzt werden, in- 
dem die Forschung das Spektrum ihrer Zugänge offenlegt und es den Praxispart- 
nern dadurch erlaubt, die eigene Sichtweise zu reflektieren. 


1.2 Transformation von Akteurswissen durch 
Transdisziplinarität 


Das skizzierte Problem der mangelnden Reflexion und Verständigung über das 
Akteurskonzept wird besonders manifest, wenn transdisziplinär gearbeitet wird, 
d.h. Wissenschaft und Praxis gemeinsam eine Fragestellung bearbeiten. ‚Trans- 
disziplinär‘ meinte eine Forschung, deren zentrales Merkmal darin besteht, dass 
wissenschaftliche Disziplinen mit außerwissenschaftlichen Praxisakteuren ge- 
meinsam Wissen erzeugen, um gesellschaftlich relevante Probleme zu lösen (vgl. 
zum Konzept für die Linguistik Perrin & Kramsch 2018; vgl. grundlegend Mittel- 
straß 2003: 9). Wir nennen die Seite der Praxis im Folgenden Praxispartner von 
angewandt linguistischer Forschung. 

Angewandt-linguistisch Forschende sind durch die Praxispartner mit Perso- 
nen, professionellen und kulturellen Identitäten wie auch mit organisationalen 
Diskursrollen (z.B. Aktanten, Agenten und Prinzipale, vgl. Taylor & Cooren 1997) 
konfrontiert, die bei der Entwicklung von Forschungsdesigns und Vermittlungs- 
formen nicht ignoriert werden können - beziehungsweise die sogar ausdrücklich 
Einfluss nehmen müssen, wenn die Forschungsziele erreicht werden sollen (vgl. 
Perrin 2012). Diese typisch transdisziplinäre Verschränkung von Wissenschafts- 
und Praxisperspektiven kann wiederum methodisch nur dann zielführend sein, 
wenn seitens der Forschenden das theoretische Bild des hier Einfluss nehmenden 
(und häufig dann auch mit untersuchten) ‚Akteurs‘ reflektiert und geschärft wer- 
den kann. Das bedeutet: Durch die Forschung rücken Prämissen in den Fokus, 
die Akteure bezüglich sich selbst und bezüglich anderer für selbstverständlich 
halten. Und genau diese Selbstverständlichkeit kann zum Problem werden. Dis- 
kursforschung von und mit Praxisakteuren ist deshalb immer auch Forschung zu 
Akteurs- und Organisationsdiskursen, und dies im mehrfachen Sinne der Dis- 
kurse von Akteuren und ihren Organisationen und der Diskurse über sie. Hier be- 
steht zunächst ein Graben zur weitgehend geteilten Auffassung in der Diskurs- 
forschung: 
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Die diskursive Konstruktion von Subjektivität: DiskursforscherInnen zeigen sich zumeist 
kritisch gegenüber subjekt- und akteurszentrierten Modellen, die Sinn als ein Produkt in- 
tentionaler Sprech- und Handlungsinstanzen fassen. Diskurs wird vielmehr als eine soziale 
Praxis gesehen, die Subjekte, Akteure und Identitäten hervorbringt. Individuen werden erst 
durch ihren Eintritt in den Diskurs zu Subjekten. Insofern sind Subjekte und Akteure ein 
Effekt diskursiver Praxis und nicht ihr Ursprung. (Angermuller 2014a: 19) 


Die Lösung der Spannung besteht nun nicht darin, Diskurslinguistik nicht zur 
transdisziplinären Anwendung zu bringen mit der Begründung, sie sei ‚theore- 
tisch voraussetzungsvoll‘. Vielmehr gewinnen die Diskursforschung und die Pra- 
xis, wenn sie gemeinsam an methodisch nachvollziehbaren empirischen Ergeb- 
nissen mit theoretischen Ansätzen den Akteursbegriff erschliessen (Dreesen & 
Stücheli-Herlach 2020; vgl. zur Darstellung des Ansatzes Diskurslinguistik in An- 
wendung in Dreesen & Stücheli-Herlach 2019). Hierzu ein Beispiel aus einem ab- 
geschlossenen transdisziplinären Projekt der Diskurslinguistik für ein Energie- 
unternehmen in der Schweiz (vgl. Dreesen & Krasselt 2021): Der Kommunikati- 
onsleiter beauftragt Teammitglieder damit, eine Untersuchung mit externen 
Sprachforschenden einzuleiten. Entwickelt wird eine Fragestellung (basierend 
auf Theorien, Methoden und Daten) in Bezug auf die diskursive Konstitution des 
Unternehmens und seiner Position in öffentlichen Kontroversen. Forschungsre- 
levant werden damit Akteure im Organisationskontext des Unternehmens, Ak- 
teure in öffentlichen Energiediskursen und Akteure auf dem Energiemarkt - letz- 
tere unabhängig davon, ob und inwiefern sie sich auch als Akteure in Diskursen 
verstehen. 

Es zeigt sich in solch einem Projekt, dass Praxisakteure ihr Selbst- und Rollen- 
verständnis in spezifischen Team- und Organisations- sowie Politik- und Marktdis- 
kursen entwickeln und aus dieser Perspektive das konzeptualisieren, was als „Dis- 
kurs“ der gemeinsame Forschungsgegenstand ist. Diesen Umstand nennen wir 
Introspektion (analog zur problematischerweise so genannten Froschperspektive 
der wissenssoziologischen Governance-Forschung, vgl. Stirling 2016). Introspek- 
tion ist, nach transdisziplinärer Auffassung, auch mit ihrer ‚subjektiven Selekti- 
vität‘ eine durchaus notwendige Bedingung für fruchtbares Forschen: Sie liefert 
hochgradig kontextualisiertes, akteursbezogenes „Insider“-Wissen (Perrin 2012: 
6). So können Selbstkonzepte als Arbeitshypothesen dienen (bspw. wir sind füh- 
rend in Sachen nachhaltige Technologien - ist das in Diskursen repräsentiert?) 
und Praktiken des Umfeldmonitorings (wie Medienclipping) als Datenquelle ge- 
nutzt werden. 

Indem transdisziplinäre Forschung die Sinnhorizonte von Wissenschaft und 
Berufspraxis systematisch miteinander verschränkt, bildet die Introspektion ei- 
nen - für die Forschung konstitutiven - Ausgangspunkt zur Bildung von Antithe- 
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sen. Bereits die Modellierung eines Diskurses in Form eines Datenkorpus nicht 
anhand von vorab festgelegten Suchwörtern, sondern mittels des Verfahrens von 
Topic Modeling (vgl. Kapitel 2.2.1) erweitert den Sinnhorizont des transdiszipli- 
nären Forschungsteams. Mit dem Topic Modeling wird über den konkreten Fr- 
kenntnisgegenstand (z.B. ‚Solarenergie in der Schweiz‘) hinaus deutlich, welche 
weiteren thematischen Aspekte eine Rolle spielen (z.B. ‚preiswerter Kohlestrom 
aus Deutschland‘), die somit selbstbezogene Akteurskonzepte verändern kön- 
nen. Mit korpuslinguistischen Methoden wird es zudem für die Praxisakteure 
möglich, diskursive Perspektiven außerhalb der zur Routine gewordenen eige- 
nen Wahrnehmungsweisen einzunehmen (sog. Extrospektion, vgl. Dreesen & 
Stücheli-Herlach 2019: 151; Dreesen 2018: 113). 

Die Lösung besteht in der Schaffung einer im jeweiligen Forschungsprojekt 
entstehenden gemeinsamen „Diskursplattform“ zum Austausch (vgl. dazu Dree- 
sen & Stücheli-Herlach 2019: 140, 154-155), um sich gegenseitig mit Akteurskon- 
zeptionen und Handlungsoptionen vertraut zu machen und vor dem Hintergrund 
des vereinbarten Projektziels zu schärfen. Im transdisziplinären Forschungspro- 
zess erhält durch den Austausch mit dem Praxispartner und dessen Rückmeldun- 
gen (Verständnisfragen, Vorbehalte, Kritik, weiterführende Fragestellungen) die 
Diskurslinguistik neue Impulse unter anderem zur Frage der diskursiven Forma- 
tion der Akteure. Dadurch wird es möglich, dass sich die vorherrschenden Ak- 
teurskonzepte auf beiden Seiten verändern. 


1.3 ‚Akteurs‘-Konkretion durch Operationalisierung 


Das Konzept ‚Akteur‘ wird im transdisziplinären Forschungsprozess für die je- 
weilige Fragestellung operationalisiert, wodurch es spezifischer und dadurch 
leichter zu vermitteln ist. In der Operationalisierung vollziehen sich zentrale 
Schritte der Modellierung des Diskurses und damit meistens des Untersuchungs- 
korpus, weil relevante Akteure als Quellen bzw. in Quellen bestimmt werden. Ein 
Beispiel aus dem abgeschlossenen Projekt ‚Energiediskurse in der Schweiz‘ in 
Kooperation mit dem Schweizerischen Bundesamt für Energie (BFE) mag dies 
veranschaulichen (vgl. Stücheli-Herlach, Ehrensberger-Dow & Dreesen 2018): 

A) Geht man von ‚Akteuren als Textproduzenten im Diskurs‘ aus, ist es of- 
fensichtlich, dass es eine Kategorie ‚Untersuchte Akteure‘ mit möglichst 
vielen Textquellen zielführend ist. Beispiel: Textquellen von staatlichen 
Behörden, journalistischen Medien, NGOs, Unternehmen. 

B) Eine weitere Differenzierung dieser Kategorie kann - im Falle eines Po- 
litikfeldes wie der Schweizerischen Energiewende - entlang der Krite- 
rien für die Produktion von öffentlichen Politiken (policies) erstellt wer- 
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den, z.B. je nachdem wird den Akteuren eine politikformulierende und 

-umsetzende (‚Behörden‘) oder eine politikbeobachtende und -vermit- 

telnde (‚journalistische Medien‘) Funktion usw. zugesprochen (vgl. da- 

zu Kap. 2.2.1 unten) 
C) Die in den Texten der ‚Untersuchten Akteure‘ vorkommenden Akteure 
können weiter unterteilt werden in 

1) ‚repräsentierte untersuchte Akteure‘, etwa wenn eine Behörde (wie 
das Bundesamt für Energie) über eine NGO (wie den WWF) schreibt, 

2) ‚repräsentierte nicht untersuchte Akteure‘, etwa wenn das Bundes- 
amt für Energie über die EU schreibt und die EU nicht zu den unter- 
suchten Akteuren gehört, 

3) ‚artifizielle nicht-untersuchte Akteure‘, etwa wenn es heisst die 
Schweiz entscheidet über die Energiezukunft wird ein Akteur ohne 
gleichsam reales, aber mit sehr grossem diskursivem (also ‚autori- 
sierten‘) Handlungspotenzial konstruiert. 


Eine solche oder ähnliche Aufschlüsselung von textuellen Ausprägungen ist für 
das Akteursverständnis zentral (ähnlich Müller 2018: 38). 


1.4 ‚Akteurs‘-Validität durch Triangulation 


Um die Operationalisierung, die Analysen und die Auswertungen zu ‚Akteuren‘ 
von Diskursen wissenschaftlich abgesichert umsetzen zu können, bietet es sich 
an, möglichst trianguliert vorzugehen (vgl. Denzin 1989; Flick 2011). Triangula- 
tion bedeutet, dass mehrere Forschende aus mehr als einer theoretischen Per- 
spektive, mit mehr als einer Methode und unter Berücksichtigung von mehr als 
einer Datensorte gemeinsam eine Fragestellung bearbeiten (Stücheli-Herlach, 
Ehrensberger-Dow & Dreesen 2018: 19-21). Die vielfachen Konstruktionen des 
‚Akteurs‘ führen mindestens unter der Anwendungsperspektive zu besseren For- 
schungsergebnissen: Je mehr aufeinander bezogene Angebote zum Verständnis 
der Diskursakteure unterbreitet werden, desto größer ist die Chance zur Vermitt- 
lung an einzelne Praxisakteure, d.h. zur intersubjektiven Verständigung über die 
Ergebnisse zum analysierten Diskurs (vgl. zur ‚Simulation‘, Kap. 2.2.4). Somit bil- 
den die integrativen, komplementären, bisweilen widersprüchlich wahrgenom- 
men Analyseergebnisse zu Fragen nach den ‚Akteuren‘ ein zentrales Ergebnis 
transdisziplinärer Diskurslinguistik: ‚Akteur‘ ist keine absolut zu setzende Kate- 
gorie, geschweige denn ein handlungsleitendes Konzept. Vielmehr stellt es ein 
heuristisches Mittel dar, das problemlösende und handlungsermöglichende 
Funktionen in der Reflexion moderner Organisationen und ihrer Vertreter er- 
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füllen kann. Verschiedene akteursbezogene Methoden und Akteurskonzepte 
können jeweils problembezogen fruchtbar gemacht werden. Zugespitzt kann 
man sagen, dass durch Triangulation die Konzeptionen des diskurstheoretisch 
‚schwachen Subjekts‘ und des pragmatisch ‚starken Subjekts‘ aufeinander bezo- 
gen werden können, indem aus dem Wissen um die akteursprägende Macht des 
Diskurses die eigenen kommunikativen Handlungsoptionen reflektiert einge- 
setzt werden: Durch transdisziplinäre Forschung entsteht so Transformations- 
wissen (Perrin 2012: 6c; vgl. ähnlich Giddens 1984: 153). Erklärbar ist dies durch 
die Praxistheorie, genauer die Strukturationstheorie: Akteure im Diskurs können 
ihr Handeln in der Regel begründen, wenn sie dazu befragt werden: 


Als soziale Akteure sind alle menschlichen Wesen hoch-,gebildet‘ im Hinblick auf jenes 
Wissen, das sie für die Produktion und Reproduktion alltäglicher sozialer Begegnungen in 
Anschlag bringen; die große Masse dieses Wissens ist eher praktisch als theoretisch (Gid- 
dens 1997: 73; vgl. auch 36, 57). 


Im Gegensatz zum praktischen Insider- und Expertenwissen (Perrin 2012: 6) fehlt 
auch interessierten Akteuren in der Regel das theoretisch systematisierte und em- 
pirisch fundierte Wissen über diskursive Handlungsbedingungen und mögliche 
Handlungsfolgen, da dies über ihre „reflexive Steuerung [...] des Alltagshan- 
delns“ (Giddens 1997: 55) hinausgeht. Ziel muss es deshalb sein, die diskursiven 
Bedingungen und Folgen des Handelns von Akteuren bewusst zu machen, indem 
das Akteurswissen um die theoretisch gestützte und empirisch fundierte Erken- 
ntnis der diskursiven Strukturierung des Sprachhandelns ergänzt wird: Indem 
„die Handelnden (kognitiv) erkennen, dass Strukturen ihre eigenen Produkte 
sind“, erhalten sie ansatzweise die „Möglichkeit [...], die Kontrolle über sie (prak- 
tisch) zurückzugewinnen“ (Giddens 1984: 153). 

Im Folgenden wird exemplarisch gezeigt, wie ausgehend von bisherigen dis- 
kurslinguistischen Akteurskonzepten ein Akteurskonzept transdisziplinär entwi- 
ckelt und wie dadurch differenzierte Schlussfolgerungen zu Handlungsoptionen 
von Akteuren (am Beispiel von Schweizer Energiediskursen) möglich werden. Im 
Schlussteil werden die Ergebnisse auf Forschungsdesiderate zum Akteurskon- 
zept bezogen. 
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2 Akteure im Forschungsprozess einer 
angewandten Diskurslinguistik 


2.1 Bisherige Akteurskonzepte der Diskurslinguistik 


Die transdisziplinäre Diskurslinguistik versteht sich als Teil der Diskurslinguistik 
und schließt unmittelbar an deren Theorien und Methoden an. Diskurslinguisti- 
sche Forschungen adaptieren, entwickeln, kombinieren und nutzen insbeson- 
dere Akteurskonzepte, die ihr jeweiliges theoretisches und empirisches Erkennt- 
nisinteresse am diskursiven Sprachgebrauch befördern (für jeweils Teilübersich- 
ten Spieß 2018: 351-354; Ismaiel 2017: 52-60; Angermiiller 2014b). Stark verkürzt 
kann festgehalten werden, dass in der sprachbezogenen Diskursanalyse bisher 
folgende akteursbezogene Ansätze verfolgt worden sind: Neben den pragmalin- 
guistischen Kategorien (etwa ausgehend von Jakobson bei Spitzmüller & Warnke 
2011: 55, 174) sind insbesondere Theorieadaptionen aus Frankreich, etwa Fou- 
caults Autor- und Subjektkonzepte (2001; 1981; Albert 2008; Warnke 2007) und 
Michail Bachtins (1985) u.a. von Ducrot (1984) weiterentwickeltes Polyphonie- 
und Äußerungsinstanzen-Konzept (Dominique Maingueneau 2014: 432-422; 
Dreesen 2013) aufgegriffen worden. Aus der US-amerikanischen Soziolinguistik 
(Reisigl & Ziem 2014: 79-82) sind das ‚voice‘-Konzept von Dell Hymes (1996) u.a. 
durch Jan Blommaert (2005: 68-77), das Footing-Konzept von Goffman (1981) so- 
wie Austins (1962) Performativität u.a. durch Taylor & Cooren (1997) aufgegriffen 
und weiterentwickelt worden. Als noch eher vereinzelt ist der diskurspragmati- 
sche Zugang zur Analyse von teilnehmenden-orientierten Diskursrealisationen 
zu nennen, der die textproduzierenden Akteure ins Zentrum rückt (vgl. Roth 
2015). Auch bisher eher punktuell sind ethnografische Zugänge in der Diskurslin- 
guistik vertreten worden (Papen 2018; Dreesen 2018). 

Korpuslinguistische und computerlinguistische Ansätze zur Entwicklung 
oder Bestimmung diskursanalytischer Akteurskonzepte liegen kaum ausgearbei- 
tet vor (vgl. jedoch Dreesen, Krasselt & Stücheli-Herlach 2021: 1-17, 19-23; Bu- 
benhofer 2018: 220-225; Müller 2015). Dies wird im Folgenden zum Anlass ge- 
nommen, um insbesondere die korpuslinguistischen sowie netzwerkanalyti- 
schen Möglichkeiten für akteursbezogene Analysedimensionen aufzuzeigen. 
Dies geschieht anhand der exemplarischen Bearbeitung der Forschungsfragen 
aus dem Projekt ‚Energiediskurse in der Schweiz‘ (Stücheli-Herlach, Ehrensber- 
ger-Dow & Dreesen 2018) für das deutschsprachige Teilkorpus: Wer oder was sind 
vor dem Hintergrund des Forschungsinteresses relevante Akteure im Diskurs? 
Welche Kategorien von Akteuren können erstellt werden? Welche Beziehung 
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zwischen den Akteuren können nachgewiesen werden? Wie wird durch bestimm- 
ten Sprachgebrauch im Diskurs ein Akteur konstruiert? Welche Handlungen wer- 
den mit welchen Akteuren in Verbindung gebracht? 

Die Bearbeitungen werden im Forschungsprozess in vier Schritten umgesetzt 
(vgl. ausführlich dazu Dreesen & Stücheli-Herlach 2019): In einem ersten Schritt 
wird gemeinsam der Untersuchungsgegenstand ‚Diskurs‘ modelliert. Hierfür wer- 
den Akteure des Diskurses identifiziert, die aus Sicht des Insiders- und des (wis- 
senschaftlichen wie professionellen) Expertenwissens als relevant erscheinen. 
Zweitens und drittens werden quantitative und qualitative Analysen (Messungen 
und Interpretationen) durchgeführt und trianguliert aufeinander bezogen. Die 
hier zugrundeliegende Triangulation besteht aus der sog. Forschenden-Triangu- 
lation in Form von Forschungsteam und Praxispartner sowie der Methoden-Tri- 
angulation (dazu die Beispiele im Folgenden). Im finalen vierten Schritt des For- 
schungsprozesses steht der Praxispartner als Akteur noch einmal im Zentrum, 
weil es darum geht, die triangulierten Ergebnisse als neue Perspektiven und 
praktische Handlungsmöglichkeiten im Diskurs aufzufassen, des nun aber aus 
der Sicht eines durch Forschung entwickelten Transformationswissens. Hierfür 
werden die Ergebnisse im Sinne praktischer Handlungsoptionen für die Praxis- 
partner simuliert. 


2.2 Exemplarische Analysen 


2.2.1 Modellierung 


Sampling der Quellen untersuchter Akteure 
Um ein Korpus zum Energiediskurs in der Schweiz zu erstellen, sind verschie- 
dene Vorüberlegungen notwendig, wobei sich die wichtigste Begrenzung durch 
die Fragestellung und ihren Fokus auf die (polit-, sprach- und wirtschafts-)geo- 
grafische Region Schweiz ergibt (vgl. zum Folgenden Stücheli-Herlach, Ehrens- 
berger-Dow & Dreesen 2018: 28-32): Wer äußert sich in welchen medialen Kanä- 
len, in welchen Kommunikationsfeldern und in welchen Sprachen zum Thema 
‚Energie‘? Das Untersuchungskorpus Swiss Applied Linguistics Corpus (Swiss-AL) 
basiert auf Kriterien und Prinzipien, die zu einer Auswahl von Quellen und Ka- 
nälen geführt haben (Krasselt et al. 2020). Diese waren in einem ersten Schritt 
themenunabhängig und konnten im Zuge der Korpuskompilierung themenorien- 
tiert zusammengestellt werden. 

Zunächst zu den drei tnemenunabhängigen Kriterien für die Auswahl von 
Quellen: 
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(1) Kanäle: Um den öffentlichen Energiediskurs der Schweiz abzubilden, ist 
die Entscheidung getroffen worden, öffentlich und kostenlos zugängliche Web- 
seiten von relevanten Quellen mit der Domain-Bezeichnung .ch zu crawlen. Der 
Fokus der Untersuchung liegt auf demokratisch-deliberativen Prozessen, für die 
käuflich zu erwerbende Onlineangebote (Paywalls, Mediendatenbanken, spezifi- 
sche Interessensgruppen) immer auch Partizipationsfilter darstellen. Im Fokus 
steht das öffentlich Geäußerte und tendenziell allgemein Rezipierbare. 

(2) Sampling aus einer Grundgesamtheit: Ein weiteres wichtiges Kriterium ist 
das Gewährleisten einer größtmöglichen Strukturgleichheit zwischen einer ange- 
nommenen Grundgesamtheit relevanter Texte mit Energiebezug in der Schweiz 
und dem untersuchten Korpus. Da nur Teilmengen einer unbekannten Grundge- 
samtheit aufgenommen werden können, spielt die Repräsentativität im statisti- 
schen Sinne keine Rolle (vgl. Biber 1993: 244); zu beachten ist jedoch, nach wel- 
cher theoretischen Modellierung die Zusammenstellung des untersuchten Kor- 
pus erfolgt: Eine möglichst große Annäherung an die Strukturgleichheit entsteht 
durch die ausgewogene Berücksichtigung von unterschiedlichen, als relevant 
angenommenen Akteuren und deren jeweilige Sammlung in möglichst großer 
Zahl (Stücheli-Herlach, Ehrensberger-Dow & Dreesen 2018; grundlegend Lemnit- 
zer & Zinsmeister 2015; Bubenhofer 2009). 

(3) Sprachlich-geografische Kriterien: Aufgenommen wurden Quellen von in 
der Schweiz (Staatsgebiet der Schweizerischen Eidgenossenschaft) domizilierten 
oder auf sie bezogen handelnden Organisationen und Personen in deutscher, 
französischer, italienischer Sprache. 

Für die Erstellung eines Korpus zum Thema ‚Energie‘ sind folgende themen- 
orientierte Kriterien bei der Auswahl von Quellen herangezogen worden: 

(4) Thematische Kriterien: Erhoben wurden Quellen mit offensichtlichen 
oder mutmaßlichen Bezügen zum thematischen Politikfeld ‚Energie‘ (i.S.v. ,Ex- 
ploration, Produktion, Distribution und Konsumption‘ von physikalischer Ener- 
gie, s. Pollak, Schubert & Slominski 2010: 11) und zu den inhaltlich-argumentati- 
ven Dimensionen, die relevant werden, wenn Energiepolitik problematisiert, for- 
muliert, implementiert und evaluiert wird (Knoepfel et al. 2011; Dunn 2012; Fi- 
scher 2003). 

(5) Situative Kriterien: Außerdem wurden Quellen mit offensichtlichen oder 
mutmaßlichen Bezügen zu diskursiven Ereignissen (vgl. Jäger & Jäger 2007: 27) 
und Medienereignissen mit Relevanz für das Politikfeld Energie und seine Poli- 
tiknetzwerke (Schneider & Janning 2006; Morgner 2009; Clarke 2012) aufgenom- 
men, beginnend mit der Reaktorkatastrophe in Fukushima im Jahr 2011, endend 
mit der Volksabstimmung über das neue Energiegesetz im Jahr 2017 und dessen 
Auswirkungen für die Schweizer Energiepolitik. 
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Das Korpus umfasst zum Zeitpunkt des letzten Releases (Juni 2019) insge- 
samt 364 Quellen. Beim Sampling der Quellen wurde auch die Zugehörigkeit der 
Quellen zu unterschiedlichen Teildiskursen festgehalten, etwa zu deren Relevanz 
für eine oder mehrere Landessprachen. Dies spiegelt sich zum einen in die Unter- 
gliederung des Korpus in verschiedene Landessprachen, zum anderen in der Un- 
tergliederung der sprachspezifischen Korpora in verschiedene Kategorien wider. 

Die Quellen gliedern sich in folgende Kategorien: Kollektivakteure der Poli- 
tikformulierung und -umsetzung (kurz PFU; Behörden und Vollzugspartner), der 
Politikbeobachtung und -vermittlung (kurz PBV, journalistische Medien), der Po- 
litikentwicklung und -beratung (kurz PEB, Wissenschaft und Bildung) sowie von 
Politikadressaten und -betroffenen (kurz PAB, Wirtschaft, Interessenverbände). 
Die Zuordnung von Quellen zu Kategorien ermöglicht nicht nur die Analyse ein- 
zelner Quellen, sondern auch einzelner Teilbereiche des Energiediskurses. 

Beim vorausgehenden Sampling der Quellen wurde bei themenunspezifi- 
schen Quellen entschieden, zunächst alle Webseiten der Domains zu crawlen. 
Dies bringt den entscheidenden Vorteil, dass das themenunspezifische Korpus 
nun die Möglichkeit bietet, es als Referenzkorpus nutzen zu können. Der Nachteil 
dieses Vorgehens ist, dass aus den zum Teil themenunabhängigen Daten durch 
Extraktion energiediskurs-relevanter Texte ein eigenständiges Subkorpus erstellt 
werden muss. Für die Extraktion ist ein corpus-driven-Verfahren in Form eines 
Topic Modeling genutzt worden, um ein energiespezifisches Korpus zusammen- 
zustellen. 

Beim Topic Modeling (s. Extrospektion in Kap. 1.2) wird ein gezogenes Sam- 
ple von verfügbaren Texten einer bestimmten Zahl an Topics zugeordnet. Topics 
sind dabei Wahrscheinlichkeitsverteilungen über die in einem Korpus enthalte- 
nen Wörter (vgl. Blei 2012). Die einzelnen Wörter wiederum können unterschied- 
lichen Topics in unterschiedlichen Graden angehören, so kann etwa das Lexem 
‚Sonne‘ dem Topic ‚Solarenergie‘ und gleichzeitig dem Topic ‚Ferien‘ zugeordnet 
werden. Durch die Wahrscheinlichkeiten der Topic-Zuordnung für einzelne Wör- 
ter lässt sich dann die Wahrscheinlichkeit berechnen, welchen Topics die einzel- 
nen Texte zuzuordnen sind. In einem iterativen Prozess offenen Kodierens wur- 
den im Anschluss Topics ausgewählt, die für das Thema ‚Energiediskurs‘ rele- 
vant sind, um das Subkorpus Swiss-AL-ED-Corpus zu bilden (Erläuterungen bei 
Stücheli-Herlach, Ehrensberger-Dow & Dreesen 2018: 30). 
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2.2.2 Messung 


Die Berechnung von Keywords erfolgte durch Vergleich des themenunabhängi- 
gen Swiss-AL-Corpus und des themenspezifischen Swiss-AL-ED-Corpus. Das Er- 
gebnis des Vergleichs sind Keyword-Listen für beide Subkorpora (ohne stop 
words), die nach statistischer Signifikanz (in Form eines Log-Likelihood-Ratio- 
Werts) geordnet sind. Anhand dieses Werts lassen sich die meistverwendeten 
Wörter pro Kategorie - zum Verständnis der Praxispartner — einfach in Form von 
Wordclouds visualisieren (vgl. Abb. 1). 
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Abbildung 1: Die 50 zentralen Keywords in den (A) Kategorien Wirtschaft (PAB), (B) Politik 
(PFU), (C) Medien (PBV) und (D) Wissenschaft (PEB) 


Die vergleichende Keyword-Analyse zeigt, dass die nach Kategorie unterteilten 
Akteure zu unterschiedlichen (thematischen) Kontexten Texte produzieren; es 
lasst sich auch zu einem gewissen Grad ableiten, welche Themen dies sind. 
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A. In der Kategorie PAB fällt auf, dass Akteure selbst Keywords sind: Zentrale 
Akteure im Wirtschaftsbereich (AEW, AKZ, ADEV, aber auch der Zusatz AG) mit 
entsprechenden Standorten (Aarau, Winterthur) sind häufig genannt. Ebenso 
sticht die Lexik hervor, die aus dem Bereich wirtschaftlicher Organisationen 
kommt (Generalversammlung, Verwaltungsrat, Geschäftsjahr), sowie die Nen- 
nung von Zahlen (unter „Zahl“ wird die Nennung verschiedener Zahlen subsu- 
miert) und Währung (CHF). 

B. Die Schwerpunkte im politischen Bereich (PFU) sind dagegen andere: Hier 
sticht die Nennung des Labels Energiestadt hervor, zu dem 451 Schweizer Städte 
und Gemeinden zählen. Aber auch Lexik aus dem politisch-kommunalen Umfeld 
ist auffallend: u.a. Gemeinde, kommunal und Reglement. Als typisch für den Be- 
reich Energie können dagegen nur wenige Keywords klassifiziert werden: was- 
sergefährdend, Wärmepumpe und geologisch. 

C. Im Vergleich zu den anderen Kategorien sind die Keywords aus dem Be- 
reich der Medien (PBV) generisch, wobei auffällt, dass hier weniger Substantive 
als eher Verben signifikant häufig verwendet werden: sagen, wollen, schreiben - 
Hinweise darauf, dass in den Medien Zitate bzw. Aussagen von anderen am Ener- 
giediskurs beteiligten Akteuren wiedergegeben werden. Anders als in den ande- 
ren Kategorien sind hier auch Bezüge zu konventionellen Energieformen und de- 
ren Verwertung zu finden (AKW, Atomkraftwerk, Treibhausgas; die Nationale 
Genossenschaft für die Lagerung radioaktiver Abfälle Nagra; Beznau als AKW- 
Standort). 

D. Im Bereich der Wissenschaft (PEB) wird deutlich, dass hier vor allem typi- 
sche Formen wissenschaftlichen Schreibens vertreten sind: Die Hinweise auf Ab- 
bildungen, die Klammern, welche nähere Erläuterungen begrenzen, die Hin- 
weise auf Symposien oder konkret deren Nennung (OTTI). Thematisch scheinen 
sich die Quellen hier besonders mit erneuerbaren Energien auseinanderzusetzen: 
thermisch, Solarenergie, Kollektorfeld, Wärmeverlustrate oder Speicher. 


Akteure im Netzwerk 

Eine robuste theoretische und methodologische Analyse der Akteure in Diskur- 
sen muss indes grundsätzlich davon ausgehen, dass Akteure öffentlicher Kom- 
munikation nur solche sind, wenn sie sich im Plenum zusammen mit anderen - 
und in Relation zu anderen - manifestieren. Goffman (1974) plädierte in seiner 
Untersuchung über das „Individuum im öffentlichen Austausch“ für ein Wissen 
über die soziale Ordnung von Beziehungen im Öffentlichen Leben (9-15) (er 
nannte das „öffentliche Ordnung“ (12)); diese Beziehungen wurden für ihn greif- 
bar, indem er empirische Indizien dafür im Rahmen einer unterstellten „Handha- 
bung von Kopräsenz“ (43) zu deuten begann. So wurde er auf das Phänomen 
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aufmerksam, dass Akteure durch Reproduktion bestimmter Regeln des Aus- 
tauschs „eine Normen erzeugende Koalition bilden“ können, „um sich von un- 
wichtigen Dingen“ zu „entlasten und sich auf ihre jeweilige Arbeit konzentrieren 
zu können“ (13). 

Analog zu diesem Ansatz kann auch die Diskursanalyse den Akteuren unter- 
stellen, in den Diskursen und durch sie voneinander zu wissen (auch ohne sich 
zu kennen oder von diesem Wissen ausdrücklichen Gebrauch zu machen). Ak- 
teurshandeln wird also beschreibbar und verstehbar durch diese Unterstellung 
eines Diskursplenums, das nun durch einzelne Muster des Sprachhandelns 
strukturiert wird. Die Analogie ist theoretisch plausibel, wenn die Unterstellung 
daraufhin lautet, dass Akteure sich in öffentlichen Diskursen vernetzen - unge- 
achtet der Tatsache, ob sie dies explizit und bewusst bzw. mithilfe dieser episte- 
mischen Metapher tun oder nicht (vgl. Bucher 2013; Schmidt 2013; van Dijk 2012; 
Stücheli-Herlach et al. 2015). Daten von und über Akteure gewinnen damit ihre 
Bedeutung, indem nun Akteure als Knoten und deren wechselseitige Nennung in 
Diskursen als Kanten (und damit Diskursbeziehungen) gedeutet werden. 

Demgemäß ist es sinnvoll, nicht nur einzelne Akteure und Kategorien von 
Akteuren zu untersuchen, sondern auch die gegenseitige Bezugnahme im Dis- 
kurs. Im Folgenden wird daher ein netzwerkanalytischer Zugang als weitere me- 
thodische Operationalisierung des Akteursbegriffs vorgestellt. Die Analyse sozi- 
aler Netzwerke ist ein klassisches Paradigma der Sozial- und Politikwissenschaf- 
ten, bei dem es um die Analyse von Beziehungen zwischen Akteuren, um Mus- 
terhaftigkeiten in diesen Beziehungen und um deren theoretische Modellierung 
geht (vgl. Carrington, Scott & Wasserman 2005; Scott & Carrington 2011; Steg- 
bauer 2008). Das Ziel ist es, Aussagen über Akteure zu treffen anhand von struk- 
turell unterschiedlichen Positionen eines Akteurs innerhalb eines Netzwerks von 
Akteuren; die Strukturmerkmale des Netzwerks geben Aufschluss über die Kom- 
munikationsrollen einzelner am Diskurs beteiligter Akteure (für die Kommunika- 
tionswissenschaft s. dazu Friemel 2008: 186). Es kann belegt werden, ob bei- 
spielsweise Akteure gleichzeitig mehrere Kommunikationsrollen spielen, dies 
jedoch in je unterschiedlichem Ausmaß. 

Diese netzwerkanalytische Sichtweise kann nun für eine diskurslinguisti- 
sche Modellierung des Akteursbegriffs genutzt werden, indem beispielsweise ab- 
gebildet werden kann, wer über wen wie häufig spricht. Eine netzwerkanalyti- 
sche Modellierung, die auf der gegenseitigen Nennung von Akteuren im Korpus 
beruht, berücksichtigt also ganz unmittelbar diskursive Handlungsbeiträge von 
Akteuren. Durch die Anwendung netzwerkanalytischer Maßzahlen auf das Kor- 
pus lassen sich klassische Rollen wie Gatekeeper/Broker, Star und Coordinator 
(vgl. Friemel 2008: 185) quantitativ bestimmen und diskurslinguistisch interpre- 
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tieren. Im Falle einer diskurslinguistischen Netzwerkmodellierung können diese 
Rollen beispielsweise durch gegenseitige Nennungen von repräsentierten unter- 
suchten Diskursakteuren operationalisiert und quantitativ erfasst werden. Das 
heißt, es können innerhalb eines Korpus in allen Texten eines Akteurs (bspw. alle 
Texte von der Webseite des Schweizerischen Energiedienstleisters Swissgrid) die 
Nennungen aller anderen Akteure ausgezählt werden (bspw. die Nennungen des 
Schweizerischen Bundesamtes für Energie). 

Diese Form der Operationalisierung zieht einige methodische Überlegungen 
und Schwierigkeiten nach sich: Zum einen werden Akteure in unterschiedlichen 
Versprachlichungen genannt. Korpuslinguistisch einfach (d.h. automatisiert) zu 
erfassen sind dabei eindeutig referenzierbare Formen wie Bundesamt für Energie 
und dessen Akronym BFE. Problematisch sind hingegen Formen, die in ihrer Re- 
ferenzierung ambig sind wie beispielsweise nominale Substitutionen wie das 
Bundesamt und Pro-Formen wie es. Diese sind nicht ohne weiteres automatisiert 
der zugehörigen angenommenen Vollform zuweisbar. Zu überlegen ist auch, ob 
unter Akteursnennung jeweils nur das textuelle Auftreten ganz spezifischer in- 
stitutionelle Bezeichnungen - wie eben BFE und Bundesamt für Energie — ver- 
standen werden soll oder aber auch die Nennung von Personen in Funktionen, 
die dieser Institution angehören (bspw. Benoit Revaz, dem Direktor des BFE). Dies 
hätte gleichsam zur Folge, Nennungen in ihrem jeweiligen temporalen und situ- 
ativen Kontext zu betrachten, da sich die Zugehörigkeit von Personen zu Institu- 
tionen ändern kann oder Personen mehreren Institutionen angehören können 
(vgl. das Desiderat in Kap. 3). Weiterhin ist zu beachten, dass Akteursbezeich- 
nungen ambig sein können, so dass nicht immer eindeutig entscheidbar ist, ob 
es sich um die Nennung eines Akteursnamens handelt oder um die Verwendung 
eines homonymen Wortes (ein Beispiel dafür ist das Wort Energiewende, welches 
sowohl die Bezeichnung für einen Akteur ist - das Onlineportal energiewende.ch 
- als auch appellativ verwendet wird, z.B.: Die Energiewende kann gelingen.) 

Abb. 2 zeigt ein Nennungsnetzwerk für das im vorangegangenen Abschnitt 
beschriebene thematische Energiediskurskorpus. Es handelt sich um ein gerich- 
tetes Netzwerk, in dem die Knoten die im Korpus untersuchten Akteure repräsen- 
tieren und die Kanten für die Nennung eines Akteurs durch einen anderen Akteur 
stehen.' Nicht enthalten sind Medienakteure, um die journalistische Praxis der 
Akteursnennung von der entsprechenden Praxis in der strategischen Organisati- 
onskommunikation zu trennen. Bei den Kanten gibt die Richtung der Pfeile an, 


1 Als Nennung wurden für das hier vorgestellte Netzwerk eindeutig referenzierbare Formen be- 
handelt (BFE, Bundesamt für Energie), nicht aber nominale Substitutionen und Pro-Formen so- 
wie dem Akteur zugehörige Personen. 
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in welche Richtung die Nennung stattgefunden hat, so dass in einem Idealtyp 
zwischen zwei Akteursknoten auch zwei Kanten vorhanden sind, nämlich immer 
dann, wenn sie sich jeweils gegenseitig in ihren Texten nennen (symmetrische 
Kanten). Das Netzwerk enthält Nennungen mit einer Mindestfrequenz von fünf, 
d.h., es wird nur dann eine Verbindung zwischen zwei Akteuren angezeigt, wenn 
mindestens fünf Nennungen im Korpus nachweisbar sind. Die Größe der Knoten 
ist abhängig vom Zentralitätswert (hier: Eigenvektor Zentralität) des dazugehöri- 
gen Akteurs innerhalb des Netzwerkes, d.h., Knoten mit einem hohen Zentrali- 
tätswert sind proportional größer dargestellt. Die Zentralität eines Knotens 
drückt aus, wie wichtig er innerhalb des Gesamtnetzwerkes ist (Bonacich & Lloyd 
2001). Es stechen Akteure hervor, die zur Akteurskategorie ‚Politikadressaten 
und -betroffene‘ (im Netzwerk mit violetten Knoten) gehören, darunter vor allem 
Energiedienstleister und -hersteller (swissgrid, bkw, axpo, alpiq). Daneben ver- 
fügen auch eine Reihe von Akteuren der Kategorie ,Politikformulierung und -um- 
setzung‘ (grüne Knoten) hervor, hier insbesondere einzelne Kantone. Zentralität 
lässt sich folglich als Maß nutzen, um ‚Stars‘ im Energiediskurs zu ermitteln. Zu 
diesen ‚Stars‘ gehört auch das Bundesamt für Energie (BFE), was für die Schwei- 
zer Perspektive insofern bemerkenswert ist, als Energiepolitik zwar auf Bundes- 
ebene reguliert, aber vor allem auf kantonaler Ebene vollzogen wird (bspw. ha- 
ben die Kantone ihre eigenen Energiegesetze und eigene, teilweise auch kommu- 
nale Energieunternehmen). Eine andere Perspektive bietet der Blick auf das Ver- 
hältnis eingehender und ausgehender Kanten innerhalb des Netzwerkes (sog. 
Gradzentralität, Brandes, Kosub & Bobo 2012). Knoten mit vielen eingehenden 
Kanten werden von vielen verschiedenen Akteuren genannt. Knoten mit vielen 
ausgehenden Kanten nennen in ihren Texten viele andere Akteure. Im vorliegen- 
den Nennungsnetzwerk gibt es eine große Anzahl Akteure, die über weniger als 
fünf eingehende und ausgehende Kanten verfügen und nur kleine Anzahl Ak- 
teure, die mehr als zwanzig eingehende und ausgehende Kanten besitzen. Die 
GPS (Grüne Partei der Schweiz, im Netzwerk als gruene bezeichnet) hat keine ein- 
gehenden Kanten, d.h., sie wird von keinem anderen Akteur im Korpus genannt. 
Im Netzwerk fungiert sie daher als Folger, da sie selbst nicht genannt wird, aber 
andere Akteure nennt. Andere Parteien, die als Akteure untersucht worden, ent- 
halten zwar eingehende Kanten, aber nicht in hoher Zahl (am höchsten rangieren 
diesbezüglich SP und SVP). Je nach Erkenntnisinteresse eines Praxisakteurs am 
Netzwerk kann aus einer weniger vernetzten Rolle der Parteien eine entspre- 
chende strategische Überlegung abgeleitet werden.? 


2 Diskursnetzwerke auf Basis von Nennungen in einem Projekt der transdisziplinären Diskurs- 
linguistik sind erstmals hier dokumentiert: Stücheli-Herlach et al. (2019: 14-15, 65-70). 
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Auf diese hier in exemplarischer Knappheit dargestellte Weise können netz- 
werkanalytische Ansätze genutzt werden, um Kommunikationsrollen von Akteu- 
ren diskursiv zu erfassen. Es bietet sich ein vielfältiger Simulationsspielraum, in 
dem unterschiedliche Blickwinkel auf Akteure eingenommen werden können 
(vgl. Kap. 2.2.4). Denkbar sind beispielsweise Netzwerkanalysen für einzelne Ak- 
teurskategorien oder auch die daten-, also netzwerkgetriebene Herleitung von 
Akteurskategorien durch die Berechnung von sog. Communities (Blondel, Guil- 
laume & Lefebvre 2008). 


Abbildung 2: Gerichtetes Netzwerk gegenseitiger Nennungen von untersuchten Akteuren im 
Schweizerischen Energiediskurs. Grün: Politik (PFU), Violett: Wirtschaft (PAB), Rot: Wissen- 
schaft (PEB); Knotengröße: Eigenvektorzentralität; Kantendicke: Anzahl Nennungen. 
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Bestimmung von Akteursähnlichkeit durch Word Embeddings 

Nicht nur mittels Netzwerkanalysen, auch durch weitere datengeleitete Ansätze 
ist es möglich, Akteure zueinander in Beziehung zu setzen: Akteursbezeichnun- 
gen, die in ähnlichen Kontexten verwendet werden, können Hinweise auf ähnli- 
che Diskursfunktionen liefern (zum Folgenden Bubenhofer, Calleri & Dreesen 
2019). Während Kollokationsberechnungen die Bestimmung gebrauchsseman- 
tisch typischer Verwendungsweisen von Lexemen (sog. Kollokationsprofil, s.u.) 
ermöglicht (vgl. Evert 2009; vgl. auch Bubenhofer 2017), systematisieren Verfah- 
ren der distributionellen Semantik (vgl. für einen Überblick Lenci 2018) dieses 
Vorgehen. Dies lässt sich verwenden, um Kollokatsvergleiche anzustellen. Das 
Assoziationsverhalten jeder Wortform oder jedes Lexems wird über die Daten ge- 
neralisiert als Wortvektor repräsentiert. Je weiter weg die beiden Wörter vonei- 
nander im Vektorraum sind, desto unähnlicher sind ihre Kollokationsprofile. Bei 
einer Variante distributioneller Semantik, sog. Word Embeddings (Mikolov et al. 
2013), werden neuronale Netze angewandt, um ein statistisches Modell der Vek- 
toren zu berechnen. Es repräsentiert für jedes Wort die typischen Kontexte und 
situiert es in einem n-dimensionalen Vektorraum. Ist die Distanz zwischen zwei 
Vektoren klein, verfügen die beiden Wörter über ähnliche Vektoren, werden also 
ähnlich verwendet (z.B. zu wieso: weshalb, warum, ...; aber zu weil: da, zwar, 
denn, ...). Die Wörter mit ähnlichen Vektoren sind dabei oft Synonyme, aber eben 
auch Antonyme, Hyperonyme, Hyponyme sowie weitere semantisch relationierte 
Wörter. 

Im Fall von Akteursbezeichnungen handelt es sich um Alternativbezeich- 
nungen, Kollektivakteursbezeichnungen sowie Akteure mit vermutlich ähnlicher 
Funktion im Diskurs. Schlägt man im Untersuchungskorpus zum Akteur WWF 
die Wörter mit ähnlichem Vektor nach, erhält man folgende nach Ähnlichkeit ab- 
steigende Wortliste: 


WWF Schweiz, Pro Natura, Umweltschutzorganisation, Umweltorganisationen, Umweltorga- 
nisation, Naturschutzorganisationen, Umweltverbände, Greenpeace, Naturschutz, Umwelt- 
verbänden, Bundesamt BAFU, Rheinaubund, Patrick Hofstetter, Stiftung Landschaftsschutz 
Schweiz, FSC, Naturschützer, Tierschutzorganisationen, ... 


Diese Liste lasst sich nun bereinigt nach akteursbezogenen Sinnrelationen ord- 
nen, z.B.: 


WWF: WWF Schweiz, Patrick Hofstetter; WWF-ähnliche Akteure: Pro Natura, Greenpeace, 
Rheinaubund, Stiftung Landschaftsschutz Schweiz/FSC Bundesamt BAFU; Kategorien: Um- 
weltschutzorganisation, Umweltorganisationen, Naturschutzorganisationen, Umweltverbdn- 
de, Naturschutz, Naturschiitzer, Tierschutzorganisationen 


Operationalisierung der diskurslinguistischen Kategorie ‚Akteur — 283 


Der Befund zeigt, dass der ausgeschriebene Name World Wildlife Fund offensicht- 
lich kaum ähnlich verwendet wird wie WWF und dass Patrick Hofstetter (Klima- 
politikexperte beim WWF Schweiz) ein zentraler Repräsentant (bzw. Aktant) der 
Organisation ist. Ferner gibt es einen Hinweis darauf, dass das Schweizer Bun- 
desamt für Umwelt in ähnlichen Kontexten vorkommt wie zivilgesellschaftliche 
Umweltschutzorganisationen. Mithilfe von Word Embeddings können nun wei- 
tere frequent vorkommende Akteure (z.B. Greenpeace) oder Akteurskategorien 
(z.B. Umweltorganisationen) ermittelt und in ihren Ähnlichkeitsgraden im Dis- 
kurs analysiert werden. 


2.2.3 Interpretation 


Die diskurslinguistischen Fragestellungen, in welcher Position, Rolle oder wel- 
chem Status ein Akteur oder eine Akteursgruppe in Erscheinung tritt, kann in Ab- 
hängigkeit vom Erkenntnisinteresse mit unterschiedlichen qualitativ-interpreta- 
tiven Zugänge erfolgen. Hier werden zwei Vorgehensweisen gezeigt, wie Akteure 
durch Handlungen und durch Kontext konstituiert werden: 


Akteurskonstitution durch Prädikation 

Im Projekt stellte sich die Frage, welche Akteure des Energiediskurses als ‚rele- 
vante Handlungen vollziehend‘ dargestellt werden. Das besondere Interesse lag 
an Entscheidungsprozessen und an Kontroversen im Diskurs. Komplementär zur 
Bestimmung der Akteursnetzwerke mittels Akteursbezeichnungen werden gram- 
matische Kategorien verwendet, indem zu den Prädikaten entscheiden und kriti- 
sieren die zugehörigen Subjekte im Satz ermittelt werden. Dies ist möglich durch 
eine korpuslinguistische Annotation von Dependenzrelationen im zugrundelie- 
genden Korpus (Manning et al. 2014; Nivre, Hall & Nilsson 2006). Dadurch kön- 
nen systematisch spezifische Verben sowie die von ihnen regierten Wörter abge- 
fragt werden. Dieses Vorgehen, auf grammatischer Basis semantische Rollen zu 
bestimmen, ist in der Diskurslinguistik bisher wenig ausgebildet (vgl. ansatz- 
weise Müller 2015). 

Innerhalb der vorab bestimmten Akteurskategorie Medien (PBV) bilden die 
folgenden als Akteure aufgefassten Subjekte die Top-3 zum Prädikat entscheiden 
(d.h. die frequenteste Kombination, n = 401): Als ‚entscheidend‘ werden die Le- 
gislative in Form der Subjekte Bundesrat/Parlament (40) sowie das Stimm- 
volk/Volk (14) dargestellt. Es handelt sich also um repräsentativ- und direktde- 
mokratisches ENTSCHEIDEN. Hingegen ist das Subjekt BKW (10) als Energiekon- 
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zern eine intermediäre Institution und in dem Sinne kein repräsentativ- oder di- 
rektdemokratischer Akteur. 

Innerhalb der Texte der wirtschaftsbezogenen Akteurskategorie (PAB) bildet 
das Unternehmen BKW und AG (,Aktiengesellschaft‘) (54) die Spitze der Top-3 
der ‚entscheidenden Akteure‘ (n = 815), gefolgt vom bekannten Bundesrat (22). 
Berücksichtigt werden muss allerdings, dass anders als im Fall der Akteurskate- 
gorie Medien in der wirtschaftsnahen Akteurskategorie die BKW selbst eine 
Quelle des Korpus ist, man also es auch mit Selbstnennungen zu tun hat (was 
auch bei netzwerkanalytischen Auswertungen zu berücksichtigen ist, vgl. Kap. 
2.2.2). Diskursanalytisch aufschlussreich ist, dass in den Texten dieser Akteurs- 
kategorie den Kunden (19) Entscheidungsmacht zugesprochen wird, etwa mit der 
Aussage ‚die Kunden entscheiden über ökologische Produkte‘. 

Doch nicht nur den Kunden, sondern auch artifiziellen Akteuren ohne reales 
Handlungspotenzial wird im ökonomischen Diskurs Entscheidungsmacht zuge- 
schrieben, z.B. im Satz Und drittens entscheiden in einem offenen Markt die Preise 
im Grosshandel über die Wirtschaftlichkeit von Kraftwerken (vgl. ähnliches Bei- 
spiel bei Bendel Larcher 2015: 28). Das marktwirtschaftliche Argument funktio- 
niert durch die Handlungs- und Verantwortungsübertragung an einen artifiziel- 
len Akteur, also durch dessen ‚Autorisierung‘ (s. Kap. 1.1.). 

Zuschreibungen demokratischer Entscheidungsmacht und ökonomischer 
Macht von Angebot- und Nachfrage gibt es in den Texten von Quellen wissen- 
schaftlicher Akteure (PEB) so gut wie nicht: Dort wird überwiegend (20 bei n = 
46) den Details eine Entscheidungsmacht zugesprochen, also ebenfalls als artifi- 
zieller Akteur eingesetzt. Dieser Befund kann durch den vorherrschenden wis- 
senschaftlichen Schreibstil erklärt werden, belegt aber zugleich auch die enge 
Fokussierung: Energie wird in der Wissenschaft detailliert perspektiviert. 

Die Befunde zeigen in der Tendenz, wie die Akteure im Diskurs nach unter- 
schiedlichen Logiken ‚autorisiert‘ werden; die Logiken lassen sich als ,Systemlo- 
giken‘, ‚Ideologien‘ oder auch als Regelwerke diskurs-,pragmatischer Regimes‘ 
(Thévenot 2001) verstehen. In der Konsequenz bedeutet dies für die Akteure un- 
tereinander, dass ihre Kontexte Tätigkeitsfelder sind, in deren Darstellung z.B. 
Entscheidungen nicht allein eine Frage menschlichen Handelns sind, sondern in 
der diskursiven Verknüpfung verschiedenartiger Akteure bestehen. 

Analog, allerdings ohne die Unterteilung nach Akteurskategorien, sind die 
Subjekte zum Prädikat kritisieren ermittelt worden. Es zeigt sich, dass KRITISIE- 
REN eine Handlung darstellt, die im Energiediskurs eindeutig den Akteuren aus 
dem Umwelt-NGO-Bereich zugeordnet ist/wird (entweder unspezifisch als Kol- 
lektivakteursbezeichnung Umweltverbände/Umweltorganisationen oder konkret 
Greenpeace, WWF, Energiestiftung, in 28 von 277 Fällen). 
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Im skizzierten korpuslinguistischen Vorgehen können die nominalen Substi- 
tutionen und Pro-Formen (vgl. Kap. 2.2.2) den Prädikaten nicht sinnvoll zugeord- 
net werden; solche nicht zuordenbare Subjekte sind ein häufiges Phänomen, was 
erklärt, warum die Grundgesamtheit in den obigen Beispielen recht hoch ist, die 
Belegzahlen jedoch gering. Doch innerhalb der eindeutig zugeordneten Fälle 
sind die Tendenzen eindeutig. Diese Hinweise können nun im Sinne der Metho- 
dentriangulation dazu genutzt werden, um komplementär vom Subjekt ausge- 
hend Prädikate zu bestimmen. 


Akteursprofil durch Kollokationen 

Es lassen sich systematisch für jeden untersuchten Akteur Kollokationen zur Ak- 
teursbezeichnung in den gängigen Schreib- und Abkürzungsweisen im Korpus 
berechnen (z.B. BFE, Bundesamt für Energie). Das so gewonnen Kookkurrenz- 
oder Kollokationsprofil (Belica 2001; Bubenhofer 2018: 222-225) weist typische 
Verwendungskontexte auf, die vergleichend als Hinweis aufein Akteursprofil ge- 
deutet werden können. Wird dieser Schritt in jeder Akteurskategorie durchge- 
führt, kann ermittelt werden, wie verbreitet und frequent Akteursnennungen 
über den kategorialen Diskursausschnitt hinaus sind, d.h. beispielsweise: In wel- 
chem unmittelbaren Kontext eingebettet erscheint der Akteur ‚BFF‘ in der Kate- 
gorie Medien im Vergleich zur Wirtschaft, Politik und Wissenschaft? Die Distri- 
bution von Akteuren ist bereits Teil des Ergebnisses, da beispielsweise festge- 
stellt werden kann, dass der überwiegende Teil der untersuchten Akteure eine zu 
spezifische Rolle in den Diskursnetzwerken spielt, als dass er in anderen Kontex- 
ten häufig verwendet wird (z.B. große, in Medien häufig genannte Wirtschafts- 
verbände kommen in der Wissenschaft so gut wie nicht vor). Im Sinne der Extro- 
spektion ist es für die Praxispartner eine neue Sicht, dass Akteure des gleichen 
Diskurses „gar keine Schnittmengen aufweisen müssen“ (Spieß 2018: 349; vgl. 
dazu die Netzwerkanalyse in Kap 2.2.2), in der Konsequenz also womöglich die 
Akteure jeweils in recht abgeschlossenen Teildiskursen präsent sind. 

Als akteursübergreifend können die Medien (PBV) aufgefasst werden, weil 
hier einige zentrale politische wie auch wirtschaftliche und zivilgesellschaftliche 
Akteure häufig Erwähnung finden und insofern auch miteinander verglichen 
werden können. Basierend auf der Akteurskategorie PBV (journalistische Me- 
dien) sind die ermittelten Kollokationsmuster zu einzelnen Akteuren in der qua- 
litativen Analyse zu Kollokationsprofilen weiterentwickelt worden. In einem fi- 
nalen Schritt sind diese Kollokationsprofile durch Vergleich untereinander als 
‚Akteursprofile‘ gefasst worden. 

So findet sich zum Beispiel ein Akteursprofil ‚Atomwirtschaft‘, das sich aus 
den zu den größten Schweizer Energiekonzernen zählenden Firmen Alpiq, BKW 
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und Axpo zusammensetzt. Es besteht erstens aus ähnlichen typischen ökonomi- 
schen Handlungsverben, zweitens aus Fremd- bzw. Eigenbezeichnungen und 
drittens aus einer Reihe von Ausdrücken, die sich auf den Ausstieg aus der Atom- 
kraft beziehen (vgl. Tab. 1). Erklärt werden kann diese Gemeinsamkeit dadurch, 
dass Alpiq, BKW und Axpo untereinander ebenfalls als Basis und Kollokat auf- 
tauchen, weil sie häufig in Aufzählungen vorkommen. 

Das aus der Analyse gewonnen Akteursprofil ‚Atomwirtschaft‘ ist stark wirt- 
schaftlich geprägt und wird mit dem von anderen Akteuren assoziierten Emblem 
(Agha 2006: 235) ‚Atomkraft‘ im Diskurs politisiert. Diese beiden Aspekte, der 
wirtschaftliche und der politische, zeigen sich auch in den Bezeichnungen Ener- 
giekonzern (neutral) und Stromriese (wertend). 


Tabelle 1: Akteursprofil von Alpiq, BKW und Axpo in PBV 


Handlungen Bezeichnungen Embleme 

verkaufen Energiekonzern Beznau 

beteiligen Betreiberin Kaiseraugst 
abkaufen Stromkonzern Fessenheim 
investieren Stromriese Mühleberg 
beteiligen Energieriese AKW 

entscheiden Konzern Sicherheitsnachweis 
übernehmen AKW-Betreiber Abschaltung 


2.2.4 Diskurssimulation und Handlungsoptionen für Akteure 


Auf der Basis einzelner triangulierter Erkenntnisse können diskursanalytische 
Messungen und Interpretationen in bestimmten Diskursmodellen nun dazu ge- 
nutzt werden, den Ertrag wissenschaftlicher Forschung wiederum zur anfängli- 
chen Introspektion der Praxispartner in Bezug zu setzen und für die Reflexion 
und Transformation von Insider- und Expertenwissen in der professionellen Pra- 
xis produktiv zu machen. Dabei kommt der transdisziplinären Forschung die Tat- 
sache zugute, dass Praxisakteure angesichts komplexer Entscheidungssituatio- 
nen verschiedene Möglichkeiten der Lösung ‚simulieren‘ müssen, um Wissen 
über neu auftretende, komplexe Problemstellungen und mögliche Lösungen 
überhaupt zu generieren (klassisch zur Lehre des Designs ist Simon 1996: 3-7). 
Simulation bedeutet in diesem praxistheoretischen Zusammenhang nicht etwa 
die Vorhersage von Wirkungsketten - also eine empirisch gestützte Prognostik -, 
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sondern ein Erproben sowohl möglicher wie auch wünschbarer Lösungsperspek- 
tiven für ein Praxisproblem (ebd.). Beispielsweise könnte das Bundesamt für 
Energie für einen allfälligen Versuch, vermehrt Themen der Nachhaltigkeit auf 
die öffentliche Agenda zu setzen (fiktives Beispiel in alleiniger Verantwortung 
der AutorInnen dieses Beitrags), entweder mit eigenen Beiträgen oder dann mit 
vermehrten Referenzen auf das Bundesamt für Umwelt und mit ihm diskursiv ko- 
alierende NGOs setzen (Kap. 2.2.2). Welche dieser Möglichkeiten die geeignetste 
ist, kann nur durch das Simulieren möglicher Strategien geleistet (und nicht etwa 
‚exakt bestimmt‘) werden (wie beispielsweise durch das Ermitteln von Antworten 
auf die Fragen, welche Nachhaltigkeitsthemen es denn konkret sind, die in öf- 
fentlichen Diskursen auch anschlussfähig wären, oder auf welche Weise solche 
Referenzen zu einer anderen Behörde gemacht werden könnten). 

Für die Simulation transdisziplinärer diskursanalytischer Lösungsansätze 
bieten sich Konzepte an, die sowohl im wissenschaftlichen wie auch im berufs- 
praktischen Wissensbestand - und den entsprechenden Diskursen von und über 
Akteure - eine zentrale Rolle spielen. Dazu zählen wir unter anderem die Kon- 
zepte der Positionierung (Spitzmüller 2013), der Sprachstrategie (Klein 2014) und 
der Diskurskoalitionen (Hajer 2009). 

Hierzu einige Beispiele: Hinsichtlich der Positionierung könnte eine Simula- 
tion unterschiedlicher Aussageweisen für nachhaltige Entwicklungsperspekti- 
ven unterstützend sein: Ob das Bundesamt beispielsweise von nachhaltiger, öko- 
logischer oder zukunftsträchtiger Energiepolitik spricht, macht durchaus einen 
Unterschied — ebenso, ob bei Illustrationen die Emblematik schmelzender Eis- 
berge, in der Sonne glitzernde PV-Anlagen oder kraftvoll rauschender Bergbäche 
(Wasserkraft) verwendet wird. Der Grund dafür liegt in der Tatsache, dass mit den 
sprachlichen (und visuellen) Variationsmöglichkeiten auch sozial registrierte Zu- 
schreibungen nicht nur des bezeichneten Sachverhalts, sondern auch des 
sprachverwendenden Akteurs und der von ihm lancierten Appelle verbunden 
sind (Spitzmüller 2013: 269-273). Hinsichtlich der Frage der Sprachstrategien 
könnte eine Simulation unterschiedlicher Verfahrensweisen des ‚Besetzens von 
Begriffen‘ oder der Bezeichnungs- bzw. Bedeutungskonkurrenz hinsichtlich 
wichtiger Konzepte wie ‚Ausstieg aus der Kernkraft‘, ‚Förderung erneuerbarer 
Energien‘ oder ‚Marktmechanismen’ hilfreich sein (Klein 2014: 350-372). Hierfür 
könnten anhand der oben vorgestellten Akteursnetzwerke die Rollen verschiede- 
ner Akteure bestimmt und Zielvorstellungen hinsichtlich anzustrebender Dis- 
kurskoalitionen mit einzelnen Akteuren entwickelt werden. Das Schmieden von 
Diskurskoalitionen (Hajer 2009: 60) durch die Wahl übereinstimmender Konkur- 
renzstrategien (ebd.) wäre eine Option, die durch entsprechende Varianten von 
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Kernbotschaften, Argumentationsmustern und Antworten auf häufig gestellte 
Fragen (Q&A) auf Webseiten simuliert werden müsste (Stücheli-Herlach 2013). 

Medial bieten sich z.B. mittels „joint displays“ (Creswell & Plano Clark 2011: 211) 
verdichtende, diagrammatische Darstellungen von Mixed-Methods-Forschungser- 
gebnissen zur Simulation an. Mit den Visualisierungen (z.B. der Netzwerkdarstel- 
lung) wird also operiert, indem die Praxisakteure aktiv ihre eigenen diskursiven 
Orientierungen assoziativ betrachten, drehen, zoomen, annotieren, überzeich- 
nen oder neu entwerfen können (vgl. zum Thema „synthetische Situationen“ Krä- 
mer 2009). 


3 Fazit und Ausblick 


Transdisziplinäre Forschungsprojekte können praktisch, aber auch methodisch 
und theoretisch Impulse geben zur Reflexion der üblicherweise zu stark verein- 
fachten bzw. zu stark abstrahierten Kategorie ‚Akteur‘. Die obigen Ausführungen 
sind also gerade nicht so zu verstehen, dass sämtliche diskurstheoretischen Prä- 
missen zum diskursgebundenen ‚Akteur‘ (vgl. etwa Spitzmüller & Warnke 2011: 
137) aufgehoben werden sollen. Für die Praxispartner ist es aber nicht diese the- 
oretische Überlegung, die die Bereitschaft befördert, eine von determinierenden 
Sprachgebrauchsmustern stärker losgelöste, weniger intentional geprägte Vor- 
stellung von Akteurshandlungen zu entwickeln oder eine weniger introspektive 
Perspektive auf das Diskursgeschehen einzunehmen. Diese Einsicht kommt erst 
mit den gemeinsamen Forschungsbefunden, die wiederum transdisziplinäre Dis- 
kurslinguistik durchaus im Sinn einer ‚engagierten Wissenschaft‘ (Vogel 2012) 
befördert.’ 

Diskurslinguistische Forschungsinteressen und Verwertungsinteressen von 
Praxispartnern sind notwendigerweise — und üblicherweise - nicht deckungs- 
gleich. Aus Forschungsperspektive sind gewisse Erkenntnisse zwar für die Grund- 
lagenforschung relevant, aus Praxisperspektive aber nicht direkt nutzbar. Und 
umgekehrt: Die professionelle Praxis kann zuweilen Simulationen nutzen, die 
sich einer genügend robusten wissenschaftlichen Begründung entziehen, aber 
neue Handlungsmöglichkeiten erschließen; sie können indes zu neuen Praxis- 
forschungen Anlass geben. Transdisziplinäre Erkenntnisse transformieren eben 
Expertenwissen in beide Richtungen. 


3 Vgl. Ethik-Kodex des FAB Digital Linguistics, https://www.zhaw.ch/storage/linguistik/for- 
schung/digital-linguistics/ethikcodex-digital-inguistics-zhaw. pdf (28.8.2020). 
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Für die diskurslinguistische Grundlagenforschung resultieren aus den hier 
vorgestellten Projektbeispielen unter anderem folgende Desiderata: Noch wenig 
ausgearbeitet sind bisher Zitationsanalysen (wer zitiert was wann von wem?). Es 
fehlt bisher ferner bei stärker diachronen korpuslinguistischen Akteursanalysen 
an dynamischen Modellierungen von Akteuren, z.B. wenn Organisationen den 
Namen oder wenn Politiker aus der Politik in die Wirtschaft wechseln und damit 
Zuschreibungen und analytische Akteurskategorien ihre Gültigkeit verlieren. 
Drängend ist dieses Desiderat, weil die Identifizierung von verantwortlichen han- 
delnden Akteuren etwa bei mehreren Social-Media-Profilen und Kanälen er- 
schwert ist sowie bei nicht zuzuordnenden Profilen und Kanälen kaum möglich 
erscheint (Dreesen/Krasselt 2022). 
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Teil IV: Linguistische Methodendiskussion im 
Aufbruch 


Martin Siefkes, Matthias Meiler 
Methodologische Diskussion: drei 
Herausforderungen und fünf Respondenzen 


Wie in der Einleitung festgestellt wurde, haben die Debatten um die Methoden 
der Linguistik in den letzten Jahren wieder erheblich an Fahrt aufgenommen. 
Diese sind natürlich stets auch verbunden mit theoretischen Fragen bezüglich 
des zu untersuchenden Gegenstands, dessen Charakter bestimmt, wie metho- 
disch angemessen auf ihn zugegriffen werden kann. Hier lässt sich festhalten, 
dass die skizzierten Diskussionen um den ontologischen Status des Gegenstands- 
bereichs der Linguistik, also der Sprache und ihrer Verwendung in unterschied- 
lichsten Medien und situativen Kontexten, ab den 1970er Jahren, bei aller manch- 
mal feststellbarer Enge und Rechthaberei der Einzelpositionen, ein ebenso ehr- 
geiziges wie berechtigtes Ziel hatten. Sie zielten nämlich auf eine einheitliche 
und universell anwendbare theoretische Fundierung der Sprachbeschreibung 
ab, die als Methodologie wesentliche Fragen zu den Methoden sowie zur Geltung 
und Güte der damit gewonnenen Erkenntnisse entscheiden könnte. 

Diese ambitionierte Zielsetzung wurde jedoch nach einigen Jahren heftiger 
Debatten, so lässt sich aus der Distanz resümieren, stillschweigend zurückge- 
stellt. Die Gründe dafür mögen im Gefühl der Mühseligkeit fundamentaler und 
(so mag es aus der Nahdistanz damals vielen erschienen sein) letztlich fruchtlos 
bleibender Auseinandersetzungen liegen. Auch eine gewisse ‚Kampfesmüdigkeit‘ 
mag sich eingestellt haben, verbunden mit dem verständlichen Interesse, sich 
doch lieber den jeweils individuell präferierten Ansätzen und mit ihnen verbun- 
denen Forschungsdesigns ‚full-time‘ widmen zu können. Eine Art theoretisch- 
methodologisches ‚Leben-und-leben-Lassen‘ bildete sich heraus, wobei sich ver- 
schiedene Schulen zunehmend getrennte institutionelle Verankerungen und 
Publikationswege schufen und sich gegenseitig in Ruhe ließen. Man kann dies 
als „eristischen Kompromiss“ betrachten (Meiler 2018: 461), ein bewährtes Ver- 
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fahren, das darauf basiert, solcherart Auseinandersetzungen um den Preis der 
Vervielfältigung des disziplinären Gegenstandes ad acta zu legen. Von den aus 
diesem Kompromiss erwachsenen Gegenständen hat man dann immerhin die da- 
hingehend gemeinsame Auffassung, dass sie unabhängig voneinander erforscht 
werden können. 

Diesen eristischen Kompromiss kann man positiv deuten als ein Aufgeben 
kleinlicher Revierkämpfe zugunsten eines toleranten Theorie- und Methodenplu- 
ralismus. Er hat jedoch auch erhebliche Nachteile. Zum einen mündet die so be- 
triebene Parallelforschung in zahlreiche attraktiv aussehende (und effektiv pub- 
lizierbare) Einzelergebnisse, die sich aber nur schwer oder gar nicht aufeinander 
beziehen lassen und somit eine Art ‚empirischen Flickenteppich‘ bilden. Zum an- 
deren bleibt der Status des eigentlichen Gegenstands vor dem Hintergrund schil- 
lernder theoretischer Grundannahmen, die je nach Ziel und Methoden einer Stu- 
die wählbar (oder zumindest flexibel anpassbar) sind, vage. 

Hat die Linguistik ihre zentralen Fragen - Was ist Sprache eigentlich, und wie 
lässt sie sich angemessen untersuchen? — zugunsten des bequemen suum cuique 
aus den Augen verloren? Dies zu behaupten, wäre angesichts der ja weiterhin 
stattfindenden theoretischen Reflexion sicherlich eine starke Zuspitzung. Ein ge- 
wisses Unwohlsein mit dem - formulieren wir es einmal provokant - faulen Kom- 
promiss, sich im theoretischen Gemischtwarenladen für den Theorie- und Metho- 
denteil der jeweils aktuellen Studie je nach eigenen Vorkenntnissen, aber auch 
nach verfügbarem empirischen Material und dafür geeignet erscheinenden Me- 
thoden zu bedienen, ist jedoch spürbar. Dieses Unwohlsein treibt sicher auch die 
aktuelle Wiederaufnahme der Grundlagendiskussionen an, um die es in diesem 
Band - mit Fokus auf den Theorie-Methoden-Nexus, als den man die Methodolo- 
gie kennzeichnen könnte - geht. 

Zu betonen ist dabei aber auch, dass es sich nicht nur um eine Fortführung 
der Diskussionen aus den 1970er Jahren handelt, die in der Einleitung zu diesem 
Band thematisiert wurden. Manche der damals zentralen Fragen stehen heute 
nicht mehr in derselben Weise im Vordergrund der Debatte. Dies gilt etwa für den 
Status der Sprache selbst, um den in den 1970er und 1980er Jahren, gerade auch 
vor dem Hintergrund der sog. „kognitiven Revolution“, heftig gestritten wurde: 
Handelt es sich bei Sprache um eine immer nur „im Einzelkopf“ existierende kog- 
nitive Repräsentation, um eine (theorieabhängig unterschiedlich modellierte) 
Abstraktion aus solchen individuellen Repräsentationen, um eine von vornhe- 
rein abstrakt gegebene, kulturell geteilte Entität, die von Individuen erlernt und 
anschließend (je unvollständig) kognitiv repräsentiert wird, oder handelt es sich 
gar, wozu sich Pinker (1994) verstieg, um einen angeborenen „Instinkt“ des Men- 
schen? Diese Frage scheint heute tendenziell (bei natürlich ganz unterschied- 
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licher Gewichtung) mit ‚sowohl als auch‘ beantwortet zu werden (vgl. Feilke 
2016: 9). Dass bestimmte kognitive Grundlagen der menschlichen Zeichen- und 
Sprachfahigkeit einerseits angeboren sind, deren evolutionärer Vorteil die rasche 
Vergrößerung des präfrontalen Kortex als distinktives Merkmal der Gattung 
Mensch angetrieben haben könnte (Deacon 1997), und dass es andererseits Abs- 
traktionen auf einer als transindividuell zu konzeptualisierenden Systemebene 
gibt (etwa syntaktische Regeln und semantische Kontextrestriktionen), die Men- 
schen sich in Auseinandersetzung mit anderen individuell aneignen müssen, um 
sie adäquat anwenden zu können, ist heute allgemein anerkannt. Dasselbe gilt 
für die soziale Natur der Sprache, ihre Prägung durch verschiedene sprachliche 
Funktionen (die weit über die reine Informationsübermittlung hinausgehen, sie- 
he hierzu bspw. die Funktionsmodelle von Bühler 1982, Jakobson 1979, Halliday 
1973, Ehlich 1998), ihre ausgeprägte medien- und gruppenbezogene Variation 
und schließlich die Freiheitsgrade ihrer situationsspezifischen Verwendung - 
wobei alle Regeln auch wieder gebrochen werden können, mit unterschiedlichen 
metaphorischen und metonymischen sowie sprachschöpferisch-kreativen Resul- 
taten. 

Begriffliche Gegensatzpaare wie etwa Theorie vs. Empirie, Struktur vs. Hand- 
lung, Natur vs. Kultur werden heute oft gar nicht mehr als Entweder-Oder, son- 
dern eher als verschiedene Beschreibungsdimensionen angesehen, die prinzipi- 
ell durchaus kombinierbar sind. Diskussionen haben sich dabei tendenziell zu 
Fragen der jeweiligen Gewichtung abgeschwächt. Diese einst theoretische Unver- 
söhnlichkeiten anzeigenden „Reizwörter“ nähern sich somit jenen Gegensatz- 
paaren bzw. Polen von Beschreibungsdimensionen an, die zusammen gedacht 
werden können oder sollten, weil sie innerhalb einer Theorie verschiedene Per- 
spektiven auf den Gegenstandsbereich markieren und nicht mehr eine Dimen- 
sion gegenüber der anderen methodologisch und methodisch marginalisieren: 
wie etwa bei den lange gepflegten Dichotomien langue vs. parole im Strukturalis- 
mus oder Kompetenz vs. Performanz in generativen Modellen, um nur zwei Bei- 
spiele zu nennen. 

Kurz gesagt werden begriffliche Gegensätze zwar immer noch zur eigenen 
theoretischen Positionierung gebraucht, jedoch toleranter und weniger aus- 
schließend als früher! - aber auch für v.a. rhetorische Zwecke (s.0.). So ist es heu- 


1 So kann vermutlich festgehalten werden, dass es mittlerweile außerhalb des diskursiven Re- 
pertoires innerwissenschaftlicher (publizierter) Auseinandersetzungen liegt, frank und frei zu 
konstatieren, dass jemandes Sprachauffassung „falsch“ sei, wie dies vor dem Hintergrund des 
(durchaus auch in der Wissenschaft geführten) Kampfes der Systeme noch möglich war (vgl. 
Helbig 1988, 79). 
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te wohl weitgehend Konsens, dass die Sprache sowohl eine kognitiv-individuelle 
Dimension besitzt, die Raum für kreative Aneignung und Weiterentwicklung 
lässt, als auch eine sozial geteilte und damit in wesentlichen Teilen verbindliche 
Entität ist. Damit lässt sich begründen, dass sowohl psycholinguistische Experi- 
mente als auch soziolinguistisch oder diskurs- bzw. konversationsanalytisch 
(und anders) orientierte Korpusstudien valide Ergebnisse liefern. Will man sich 
jedoch nicht auf den oben angesprochenen eristischen Kompromiss zurückzie- 
hen, darf man diese Ergebnisse nicht lediglich nebeneinanderstellen, sondern 
wird versuchen müssen, sie aufeinander zu beziehen oder sogar in übergeordne- 
ten Modellen miteinander zu integrieren. Es bedarf einer eingehenden Vermitt- 
lung der jeweiligen Vorannahmen, um zu einer theoretischen Integrationsper- 
spektive auf methodisch unterschiedlich gewonnene Erkenntnisse vordringen zu 
können. Eine solche Perspektive muss dann freilich die Gretchen-Frage nach der 
angemessenen Sprachbeschreibung wieder aufgreifen, nach Maßstäben für The- 
orieentscheidungen suchen, grundlegende von abgeleiteten Theoremen unter- 
scheiden und dabei darauf abzielen, die bestehenden Resultate in einem ergeb- 
nisoffenen Prozess nach ihrer Geltung und Reichweite in ein (inkrementell und 
dialektisch zu konstruierendes) Gesamtbild einzuordnen. 

Auf die „alten Kämpfe“ der 1970er Jahre müsste man sich dabei in gewisser 
Weise also doch auch zurückbesinnen - befände sich dabei aber gerade in me- 
thodischer Hinsicht in einer anderen Ausgangslage, da sich nicht nur die quanti- 
tativen Herangehensweisen rasant entwickelt haben, sondern auch die qualitati- 
ven Methoden interdisziplinär viel stärker verankert sind. Da diese Rückwen- 
dung aber bisher kaum zu verzeichnen ist, sei an dieser Stelle noch gefragt: Wo- 
rum geht es in der aktuellen Methodendiskussion, die sich als erneut entfachte 
Diskussion um die Grundlagen der Linguistik herausstellen könnte, und der in 
diesem Band mit methodologischem Fokus Raum gegeben werden sollte? Einige 
Hauptlinien seien im Folgenden skizziert, ohne Anspruch auf Vollständigkeit. 


Blicken wir auf den vorliegenden Band zurück, in dem aktuelle Positionen im 
Hinblick auf methodische Innovation und methodologische Fragen beleuchtet 
werden, dann fällt zunächst die große Diversität der Perspektiven auf. Bei aller 
Unterschiedlichkeit können jedoch auch Grundlinien der aktuellen Diskussionen 
festgehalten werden. Diese ergeben sich primär aus den folgenden Herausforde- 
rungen, denen sich die aktuelle Linguistik gegenübersieht, und auf die in ver- 
schiedener Weise reagiert wird — wobei es jedoch ersichtlich keine Option mehr 
ist, diese Herausforderungen nicht anzunehmen. 

Beginnen lässt sich mit der Tatsache, dass das in der Linguistik lange salon- 
fähige Behaupten universeller Prinzipien ausgehend von - mitunter selbst kon- 
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struierten - Einzelbeispielen heute im Regelfall nicht mehr als tragbar gelten 
kann. Dem steht mittlerweile eine etablierte und unzweifelhaft erfolgreiche Viel- 
falt empirischer Argumentationsstrategien gegenüber: Empirische Absicherung 
und Angemessenheit muss dabei nicht gleich eine quantitative Korpusanalyse 
einer randomisiert gezogenen Stichprobe aus dem zu untersuchenden Sprachbe- 
reich samt Validierung gefundener Auffälligkeiten mit inferentieller Statistik be- 
deuten (obwohl dies für einige Fragestellungen durchaus die angemessene Vor- 
gehensweise ist). Unterschiedliche Formen des Korpusumfangs und der Analyse- 
verfahren sind gang und gäbe und können sich auch produktiv ergänzen. Kaum 
mehr strittig ist jedoch, dass die empirische Überprüfung von Hypothesen oder 
sogar Theorien heute in Bezug auf Menge und Qualität der Daten sowie ihrer Aus- 
wertung höheren Standards genügen muss als noch vor einigen Jahrzehnten. 

Lässt sich dies mit einigem Wohlwollen noch als methodologische Fortent- 
wicklung charakterisieren, die frühere Ergebnisse weniger in Frage stellt als neue 
Überprüfungen erfordert, so stellt die „multimodale Revolution“ manche traditi- 
onelle Gewissheit über Sprache(n), ihre angemessene theoretische Erfassung 
und Beschreibung noch einmal neu auf den Prüfstand. Sie kann daher als zweite 
Herausforderung für die Methodologie der gegenwärtigen Linguistik charakteri- 
siert werden. Die sich durchsetzende Erkenntnis, dass Sprache in Isolation von 
anderen Zeichensystemen und sozialen Verwendungskontexten nicht angemes- 
sen beschrieben werden kann, bringt so manchen stolzen Theorie-Thron ins 
Wanken und - um in der Metapher zu bleiben - die Köpfe zuvor unangefochtener 
Autoritäten ins Rollen. Dies gilt umso mehr, als inzwischen auch auf der Ebene 
des Sprachsystems eine vollständige Trennung von anderen Zeichenarten nicht 
mehr möglich scheint (Fricke 2012). Die Erkenntnis, dass monomodale Kommu- 
nikation, die nur einen einzigen Zeichentyp nutzt und eine Sinnesmodalität an- 
spricht, in der Praxis kaum zu existieren scheint, bringt natürlich auch die Semi- 
otik, die zwischenzeitlich mancherorts schon zum alten Eisen geworfen worden 
war, wieder an zentraler Stelle ins Spiel. 

Eine dritte Herausforderung, die die Beiträge auch dieses Bands prägt, ist 
sänzlich anders gelagert. Sie ließe sich, etwas zugespitzt, als „Explosion metho- 
discher Mittel“ in den letzten Jahrzehnten charakterisieren. Sie wird maßgeblich 
angetrieben durch den Computer, durch immer leistungsfähigere Software und 
Analysetools, durch das Internet (mit Möglichkeiten wie Crowdsourcing oder Ci- 
tizen Science) sowie durch neue Sensorik, Aufnahme-, Mess- und Analysetechni- 
ken, die erstmals große multimodale Datenmengen in hoher Qualität liefern. Da- 
bei werden durch innovative Aufnahmeformate, etwa unter Integration von 
Motion Capture zur Erfassung von Gestik und Proxemik oder von Eyetracking zur 
Erfassung von Blickbewegungen und Pupillendilatation, auch neue Aspekte 
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multimodaler Kommunikation zugänglich. Auf diese Weise wird zudem die so- 
ziale und mediale Bedingtheit jedweder Kommunikation, die insbesondere die 
Sozio- und Medienlinguistik seit langem betonen, in weit höherer Granularität 
erfassbar. Große multimodale Untersuchungskorpora, die häufig intern entlang 
einer oder mehrerer Dimensionen strukturiert sind, ermöglichen Varianzanaly- 
sen von Kommunikation in Abhängigkeit von verschiedenen medialen, kontext- 
und personenbezogenen Faktoren. 

Zwar besitzt die Linguistik lange Erfahrung mit Video- und Tonaufnahmen 
‚aus dem Feld‘, und hat die stete Fortentwicklung von Aufzeichnungs- und Ana- 
lyseverfahren bereits umfassend reflektiert. Die oben skizzierten Entwicklungen 
sprengen aber den bekannten Rahmen gleich mehrfach, nämlich in Hinblick auf 
die schieren Datenmengen, die in kurzer Zeit um mehrere Größenordnungen an- 
wuchsen; im Hinblick auf Qualität und Vielfalt der (getrennt oder gemeinsam 
nutzbaren) Aufzeichnungsformate und schließlich im Hinblick auf neue soft- 
warebasierte Auswertungs- und Analysemöglichkeiten. Besonders hervorzuhe- 
ben sind hier die neuronale Prozesse imitierenden Deep-Learning-Verfahren zur 
Mustersuche und automatischen Detektion von Ausdruckseinheiten, die in den 
letzten Jahren gerade bei Sprach-, Bild- und Videodaten die Erwartungen weit 
übertroffen haben. 

Die neue Vielfalt, Komplexität und Qualität der Daten und Auswertungsmög- 
lichkeiten kann somit als die dritte Herausforderung an die Methodologie der ak- 
tuellen Linguistik verstanden werden. Sie ist prinzipiell positiv zu bewerten, 
schafft sie doch eine Reihe neuer Möglichkeiten, von denen frühere Linguist*in- 
nen kaum zu träumen wagten. Doch neue Möglichkeiten gehen stets mit neuen 
Herausforderungen einher, und gerade die skizzierte Datenrevolution könnte 
eine methodologische Refundierung der Linguistik nötig machen. Diese wird 
auch bewährte methodische Gegenüberstellungen, etwa Struktur- oder Hand- 
lungsanalysen anhand kleinerer Datenmengen vs. korpusbasierte Sprachvaria- 
tions- und Diskursstudien vs. Performanz- und Rezeptionsuntersuchungen in 
und außerhalb von experimentellen Settings, überdenken müssen. Wie es bereits 
in vielen anderen Wissenschaften der Fall war (Physik und Biologie seien nur 
exemplarisch genannt), sind es neue Messverfahren und Technologien, die den 
Zugang zum Gegenstandsbereich aufeine höhere oder zumindest alternative Stu- 
fe heben und damit auch die Reflexion dieses Zugangs und seiner Voraussetzun- 
gen wieder neu einfordern. 

Gerade der letztgenannten Reflexion wird als Kehrseite der vorgenannten 
Herausforderungen in der Methodenentwicklung auch innerhalb der Linguistik 
wieder verstärkte Aufmerksamkeit zuteil: Es ist unter anderem die Frage nach 
dem Zugang zum sprachwissenschaftlichen Gegenstand, welche die Methoden- 
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diskussion der 1970er beherrscht hatte und sie stellt sich heute angesichts quan- 
tifizierender Methoden nicht weniger. Dabei stehen sich gewissermaßen die Hoff- 
nung auf statistische Validierung nach naturwissenschaftlichem Vorbild und die 
Einsicht in die situations- wie praxisbezogenen Konstitutionsbedingungen des 
Gegenstandes und seiner Verstehbarkeit in einem nicht-trivialen Spannungsver- 
hältnis gegenüber (Ehlich 1993). Dieses Spannungsverhältnis kann in die eine 
oder in die gegenläufige Richtung aufgelöst oder die Unterschiedlichkeit der bei- 
den in mancher Hinsicht komplementären Zugänge fruchtbar gemacht werden 
(z.B. Perrin 2012). Letzteres geschieht beispielsweise dann, wenn über quantita- 
tive Zugänge Salienzen aufgedeckt werden, welche anschließend text- oder se- 
quenzanalytisch-hermeneutisch einer genaueren Betrachtung zugeführt wer- 
den, oder auch dann, wenn mittels einer reichhaltigen ethnografischen Erschlie- 
Rung eines Feldes die Ausgangsbedingungen für eine quantitative, aber spezi- 
fisch feld- und situationsadäquate Analyse der zu untersuchenden Kommunika- 
tionsprozesse oder -strukturen allererst eingeholt werden (vgl. auch Dang-Anh/ 
Rüdiger 2015; Klemm/Michel 2014). Da quantifizierende Erhebungs- und Analy- 
severfahren die Dimensionen des Verstehens, Wissens und der Bedeutung me- 
thodisch ausklammern müssen, können sie bei der Wiedereinholung dieser Di- 
mensionen allein schon aufgrund der überwältigenden, einen einzelnen Geist 
überfordernden Korpusgrößen konkrete methodische Operationen der Herme- 
neutik nicht umgehen, wobei für das jeweilige Korpus diverse Homogenitätsun- 
terstellungen (explizit oder implizit) kaum vermeidbar sind. Dass sich solche Un- 
terstellungen häufig als gegenstandsunangemessen erweisen, zeigt die Metho- 
dendiskussion gerade in jenen Forschungsfeldern, in denen die Akkumulation 
von Datenmengen zwar eigentlich besonders leicht ist, weil sie ohnehin immer 
schon in digitaler Form vorliegen, man der Diversität von kommunikativen Prak- 
tiken aber mit Distant-Reading-Methoden nicht gerecht werden kann. Hier, also 
im Bereich der linguistischen Erforschung digitaler Medien, werden die Vielfalt 
ethnografischer Methoden, dichte Beschreibungen und intime Kenntnisse diver- 
ser Praxisgemeinschaften zunehmend als unverzichtbar eingeschätzt und erle- 
ben eine Konjunktur, welche die traditionelle Orientiertheit linguistischer For- 
schung auf Produktanalysen aufbricht. 

Die Beiträge des vorliegenden Bandes verhalten sich zu den genannten Her- 
ausforderungen in verschiedener Weise und mit unterschiedlichen Schwerpunkt- 
setzungen. Sie berücksichtigen diese jedoch durchgehend in Fragestellungen, 
Korpuskonstruktion und Studiendesign. Dies soll hier zum Abschluss nicht noch- 
mal en detail auseinandergesetzt werden. Stattdessen wurde den Beitragenden 
die Möglichkeit zur Respondenz geboten, um im Dialog über die obenstehenden 
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(Heraus-)Forderungen und Provokationen den Aufbruch gemeinsam auf den 
Weg zu bringen. 

Alle Beiträger*innen erhielten daher die Möglichkeit, mit einer eigenen Re- 
flexion auf den obenstehenden Teil dieses Beitrags zu reagieren, oder weitere 
Überlegungen ausgehend von den Grundlinien und Beiträgen des Bands hinzu- 
zufügen. Von dieser Option haben fünf Beiträger*innen(-teams) Gebrauch ge- 
macht. 

Diesen fünf Respondenzen folgt eine method(olog)ische Positionierung zur 
linguistischen Methodendiskussion in Form von XI. Thesen, in welchen die Her- 
ausgeber den vorangegangenen Text und die folgenden Respondenzen pointiert 
bündeln. 
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Respondenz von Simon Meier-Vieracker & 
Catharina Vögele 


Den von den Herausgebern geschilderten drei Herausforderungen für die Metho- 
dologie der Linguistik wollen wir eine vierte an die Seite stellen, die sich jedoch 
mit guten Gründen auch als dazu quer liegend beschreiben ließe: Die interdiszi- 
plinäre Öffnung. Wir sehen hierin zum einen eine Fortschreibung ohnehin beste- 
hender Tendenzen, welche auch die Herausgeber adressieren. Die kognitive 
Wende rückt die Linguistik in die Nähe der Kognitions- und vielleicht sogar der 
Neurowissenschaften, die Soziolinguistik schließt an soziologische Theorien und 
Fragestellungen an und auch ethnographische Ansätze sind sozusagen interdis- 
ziplinäre Entlehnungen. Zum anderen halten wir die ausdrückliche Suche nach 
interdisziplinären Anschlussstellen für eine fortwährende Aufgabe einer um wis- 
senschaftliche wie auch gesellschaftliche Relevanz bemühten Linguistik. Wir ha- 
ben dies in unserem Beitrag am Beispiel des Brückenschlags zwischen zwei Dis- 
ziplinen diskutiert, die auf den ersten Blick sehr nah beieinander liegen, in der 
akademischen Realität aber doch allzu oft unabhängig voneinander agieren, 
nämlich Sprachwissenschaft und Kommunikationswissenschaft. 

An unserem gewählten Untersuchungsgegenstand, Transfergerüchten im 
Bereich des Profifußballs, interessieren wir uns vorderhand für das Gleiche, näm- 
lich für sprachliche Gerüchtekommunikation (und gemessen an den von den 
Herausgebern beschriebenen multimodalen Erweiterungen ist unser Zugriff auf 
Sprache tatsächlich eher restriktiv). Die durchaus divergierenden Fragehorizonte 
und vor allem die ganz unterschiedlichen Analysemethoden des Datenmaterials 
haben jedoch zur Folge, dass die Anschlussfähigkeit beider Disziplinen in be- 
grifflichen Feinabstimmungen und terminologischen Übersetzungsleistungen 
erst hergestellt werden muss, damit ein Mixed-Methods-Ansatz gelingt. Die von 
den Herausgebern umrissenen Grundsatzfragen etwa nach dem Verhältnis von 
Kognition und sozialer Praxis rücken in diesem forschungspraktisch motivierten 
Prozess zunächst in den Hintergrund. Wir müssen uns vorläufig auf eine Art Ar- 
beitskonsens beschränken, um interdisziplinär anschlussfähig zu bleiben und 
die Ergebnisse unseres jeweiligen methodischen Vorgehens aufeinander bezie- 
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hen zu können. Dies aber kann in einem zweiten Schritt sehr wohl dazu anregen, 
auch die grundlegenden Fragen nach dem Status und den Konstitutionsbeding- 
ungen unserer disziplinären Gegenstandsbereiche zu stellen. Das betrifft in un- 
serem Falle etwa den Begriff des Inhalts, der für die quantitative Inhaltsanalyse 
von zentraler Bedeutung ist, oder das Konzept der sprachlichen Perspektivie- 
rung, auf das medienlinguistische Analysen abzielen. Und selbst methodische 
Gewissheiten können so ins Bewusstsein gehoben werden. Die von den Heraus- 
gebern beschriebene Komplementarität von zunächst quantitativen (d.h. korpus- 
linguistischen) und anschießend hermeneutischen (etwa textanalytischen) Zu- 
gängen stellt sich in der quantitativen Inhaltsanalyse kommunikationswissen- 
schaftlicher Prägung noch einmal anders dar, indem hier die Quantifizierung den 
Endpunkt der Analyse markiert. 

Für eine umfassende Methodenreflexion in der Linguistik möchten wir des- 
halb die besonderen Erkenntnispotenziale interdisziplinärer Zusammenarbeit 
betonen. Das mag in dem ‚Aufbruch‘, den die Herausgeber proklamieren, ohne- 
hin schon angelegt sein. Aber nur in konkreten Joint Ventures, so anstrengend 
sie auch im Einzelnen sein mögen, können diese Potenziale auch ausgeschöpft 
werden. 


Respondenz von Maximilian Krug 


Die Herausgeber beschreiben, wie im Verlauf der Entwicklung der Linguistik ei- 
nige methodische Fragen in den Hintergrund rücken und andere, z.B. zum Ver- 
hältnis von Sprache und Körper, in der multimodal forschenden Linguistik wie- 
der vermehrt diskutiert werden. Insbesondere die multimodale Perspektive ist 
aus der interaktionslinguistischen und konversationsanalytischen Forschungs- 
landschaft nicht mehr wegzudenken. Multimodale Linguistik ist auf der einen 
Seite eine sinnvolle Erweiterung unserer Disziplin - denn wie die Herausgeber 
argumentieren, ist monomodale Kommunikation extrem selten. Auf der anderen 
Seite erfordert der multimodale Ansatz häufig ein methodisches Umdenken. Als 
Linguist*innen fokussieren wir nach wie vor oft zuerst die sprachliche Ebene und 
ergänzen diese dann bei Bedarf um weitere Modalitäten. Aus diesem Vorgehen 
(und bei der von mir gewählten Vorstellung, menschliche Kommunikation sei in 
Ebenen organisiert) ergibt sich die Auffassung, Sprache sei nur einer von vielen 
Bausteinen (andere Vorstellung, gleiches Problem) in Kommunikation, die man 
nach Herzenslust herausnehmen und neu arrangieren könne. Vielleicht sollte 
man sich das Verhältnis von Sprache und Multimodalität stattdessen wie zwi- 
schen Öl und Wasser vorstellen: Beide bewegen sich dynamisch in einem Raum- 
Körper-Zeit-Medium-Rahmen, beziehen sich unmittelbar aufeinander und lassen 
sich nur mithilfe von speziellen Methoden und Messinstrumenten trennen. 

In meinem Beitrag gehe ich der Frage nach, welches methodische Rüstzeug 
der interaktionslinguistischen und konversationsanalytischen Forschung zur 
Verfügung steht, um Fälle zu analysieren, die zwar wenig bis keine Sprache auf- 
weisen, in denen aber erkennbar interagiert wird. Im Beitrag wird deutlich, dass 
die Beteiligten in den analysierten Fällen keinesfalls anzeigen, dass eine Ebene 
oder ein Baustein fehlt, weshalb die Kommunikation gestört wäre, sondern dass 
andere Modalitäten (für eine begrenzte Dauer) Funktionen übernehmen können, 
die sonst der Sprache zukommen. Möchte man mehr über diese Funktionen her- 
ausfinden, lohnt sich die Arbeit mit Messinstrumenten. Wie von den Herausge- 
bern dargestellt, sind in der multimodal orientierten Linguistik aktuell vor allem 
Eyetracking und Motion Capture relevant. In Disziplinen, die standardmäßig mit 
technischen Messinstrumenten arbeiten, ist es häufig selbstverständlich, Fehler- 
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koeffizienten und Abweichungen anzugeben. Wenn in der Linguistik mit diesen 
Messinstrumenten gearbeitet wird, erfolgt diese Reflexion (noch) zu selten. Ne- 
ben Messfehlern ergeben sich bei der Arbeit mit Messinstrumenten noch eine 
ganz andere zentrale methodische Frage: Wie geht man analytisch damit um, un- 
ter Umständen genauere Aussagen über die Hand-Augen-Koordination von In- 
teragierenden anstellen zu können, als den Proband*innen bewusst ist (und als 
möglicherweise für die Interaktion relevant ist)? Außerdem besteht - quasi dia- 
metral zum Problem der sprachzentrierten Analyse von Interaktion — die Gefahr, 
dass der Fokus des Messinstruments den Blick auf die Gesamtheit der Interaktion 
und den Gegenstand der Sprache verengt. Vielleicht kann in diesem Zusammen- 
hang der vorliegende Band eine neue Methodenreflexion anregen und - aus mul- 
timodaler Perspektive - dazu beitragen, Sprache und andere Modalitäten weni- 
ger als austauschbare Ebenen oder Bausteine zu betrachten und stattdessen 
mehr wie Wasser und Öl als zwar unterscheidbare, aber schwer zu trennende Fle- 
mente im dynamischen Prozess der Interaktion zu verstehen. 


Respondenz von Philipp Dreesen & 
Julia Krasselt 


Über ein Fach, eine Disziplin oder eine Schule nachzudenken, erfordert einen 
wissenschaftlichen Zugang. Den Zustand des Faches vor allem mit Fokus auf die 
Methoden zu diskutieren, ist ein solcher Zugang, der transparent begründet wer- 
den kann: Ludwik Fleck (1980 [1935]) hat in Entstehung und Entwicklung einer 
wissenschaftlichen Tatsache beschrieben, wie Methoden als Teil einer sozialen 
Forschungspraxis (des Denkstils) sowohl in Routinen des Wahrnehmens vom zu 
untersuchenden Gegenstand wie auch in kollektiver Disziplinierung wirksam 
sind (vgl. hierzu und zum Folgenden Andersen et al. 2018, 14-36). Fleck zeigt uns 
im biologischen Forschungsprozess eindrücklich, dass vor allem die eben gerade 
nicht vollkommen frei gewählte, sondern disziplinär erworbene und inkorpo- 
rierte Methode unser Bild vom untersuchten Objekt erzeugt und es nicht das ge- 
wählte Objekt ist, dessen wir uns in freier Methodenwahl nähern. Wer in Studium 
oder Workshop in prägender Weise korpuslinguistische Methoden vermittelt be- 
kommen und in der Folge erlernt hat, wird diesen Denkstil vermutlich später 
auch beibehalten. In der Folge wird sich diese Person in Denkkollektiven des glei- 
chen Denkstils bewegen, die womöglich Schwierigkeiten haben zu verstehen, 
wie das Untersuchen von Sprache ohne breite empirische Basis ausreichen kann. 
In Denkstile der deutschen Sprachwissenschaft (Andersen/Fix/Schiewe 2018) liegt 
eine exemplarische Annäherung an prägende Entwicklungen und ihre Effekte 
der jüngsten Fachgeschichte vor. 

Mit den Fleckschen Begriffen kann man festhalten, wie die folgenden von 
Martin Siefkes und Matthias Meiler angeführten Aussagen verstanden werden 
können: Ob es „den ontologischen Status des Gegenstands der Linguistik“, den 
„Status der Sprache selbst“ oder die „[eigentliche] Sprache“ gibt, ist bereits das 
Ergebnis eines erworbenen, eines eingeübten Denkstils. Die Frage ist also, wel- 
che disziplinären Handlungsroutinen führen zur Vorstellung einer ‚Sprache an 
sich‘? Was muss ausgeblendet, als nicht-sprachlich betrachtet werden, um eine 
Vorstellung einer ‚eigentlichen Sprache‘ zu bekommen? Zu nennen wären hier 
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etwa die Strukturbäume der Generativen Grammatik: „Je tiefer wir in ein Wis- 
sensgebiet eindringen, desto stärker wird die Denkstilgebundenheit“ (Fleck 1980 
[1935]: 109). Solche Vorstellungen sind aber nicht nur Ergebnis einer durch rou- 
tinisierte Praktiken und Methodenzwänge erzeugten Vorstellung von Sprache, 
sie sind in hohem Maße auch das Ergebnis von gewachsenen Teildisziplinen, 
Schulen, Lehrstühlen, Handbüchern u.A. (vgl. Fleck 1980 [1935], 146-164). 

Wird die Methodenfrage auf das Fach integrierend oder zentrifugal wirken? 
Eine integrierende Wirkung versuchen die immer wieder in Selbstbefragung 
mündenden Diskussionen um die Grenzen des Faches („Ist das noch Linguis- 
tik?“, „Darfich dazu forschen?“) oder um Kritik, Normativität und gesellschaftli- 
che Positionierung („Darf die Linguistik sich kritisch in gesellschaftliche Dis- 
kurse einmischen?“) zu entfalten. Sie sind geradezu konstituierend für einige 
Disziplinen des Faches. Davon zeugt beispielsweise die Diskussion in insbeson- 
dere experimentell arbeitenden Teildisziplinen der Linguistik (z.B. Neuro- und 
Psycholinguistik) um den Status des Faches als Naturwissenschaft („linguistics 
as science“) und um eine deutliche Abgrenzung von einem Verständnis der Lin- 
guistik als Philologie (vgl. Yngve 1986). 

Auch gegenüber dem Einsatz von digitalen Methoden gibt es Vorbehalte. An- 
gesichts einer teilweisen Beharrung u.a. durch Sein-Sollens-Schlüsse werden die 
auf die germanistische Linguistik zukommenden Methodendiskussionen eher 
zentrifugal wirken. 

Es ist für die germanistische Linguistik wünschenswert, sich zu ändern. Die 
von Martin Siefkes und Matthias Meiler aufgezeigten Herausforderungen wie Gü- 
tekriterien, das Spannungsfeld zwischen semiotischen Grundlagen und multi- 
modaler Entgrenzung sowie der Methodenpluralismus stehen ohne Frage im Zen- 
trum eines Transformationsprozesses; sie wirken aber vor allem deswegen so 
stark, weil Interdisziplinarität, Internationalisierung und auch Forschung in Pro- 
jekten (vgl. Czachur 2021) das Denken und Publizieren verändert, in deren Folge 
viel frische Luft ins Fach strömen kann (zu weiteren Aspekten vgl. Andersen et 
al. 2018: 62-65). 

In den Nachhaltigkeitsdiskursen wird das Konzept der Exnovation in Kontra- 
diktion zur Innovation diskutiert (vgl. Kimberly 1981: 91-92). Auf die Linguistik 
übertragen: Eine erfolgreich eingesetzte Praktik wie die händische Annotation 
war eine Innovation im Fach, wird aber zur Exnovation, d.h. bewusst aufgege- 
ben, weil es - wenngleich noch nicht genauere - schnellere und kostengünsti- 
gere Möglichkeiten gibt, z.B. durch KI. Gibt es solche Exnovationen durchgehend 
im Fach? Können wir Erkenntnisfortschritt anhand unserer neuen und unserer 
überwundener Methoden, Denkstile feststellen? 
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Der sich abzeichnende Witz der zentrifugalen wie integrierenden Entwick- 
lung in den Methodenfragen des Faches besteht womöglich darin: Der Teil der 
Linguistik, der eine geistes-, kultur- oder sozialwissenschaftliche Vorstellung 
von Sprache teilt, nähert sich wieder stärker der empirischen Forschung an und 
rückt damit näher an die sich naturwissenschaftlich verstehende Linguistik her- 
an. Im Zuge der Digital Humanities wird verstärkt systematisch über Daten, Me- 
thoden und Forschungsethik gesprochen, wie es beispielsweise in den Life Sci- 
ences schon Standard ist. Damit wird es auch möglich, über Fachgrenzen hinweg 
Methodenprobleme zu besprechen. Das ist zu begrüßen, wenngleich sich dar- 
über die Wahrnehmungsmöglichkeiten des Untersuchungsgegenstands ändern 
werden (siehe Fleck). So ist es zum Beispiel nun möglich, in großer Zahl mit Me- 
tadaten zu arbeiten, d.h. etwa Social-Media-Daten nicht nur als Objektsprache zu 
analysieren, sondern Parameter wie Zeitpunkte oder Interaktionsgrade mitzube- 
rücksichtigen und mit sprachlichen Mustern in Beziehung zu setzen. Noch ist of- 
fen, in welcher Form der Gegenstand ‚Sprache‘ anders bearbeitet, ergo wahrge- 
nommen und gedacht werden wird. 
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Respondenz von Eilika Fobbe 


Die von den Herausgebern formulierten Herausforderungen für die Linguistik ha- 
ben für den forensischen Kontext, den der Artikel Linguistik und psychologische 
Täuschungsforschung tangiert, eine spezifische Relevanz. Zunächst ist da das Ne- 
beneinander von Psychologie und Linguistik, dem der interdisziplinäre Aus- 
tausch fehlt, welcher Diskussionen über den Status des Untersuchungsgegen- 
standes erst möglich machen würde. Während die Psychologie dabei auf sich 
konzentriert bleibt, besteht in Teilen der forensisch-linguistischen Community 
die Tendenz, sich psychologische Forschungsergebnisse speziell zu den verbalen 
Aspekten des Lügens anzueignen, ohne jedoch die Anstrengung zu unterneh- 
men, die jeweiligen Vorannahmen linguistisch zu verhandelt. Es wird der 
Wunsch erkennbar, unter Rückgriff auf psychologische Erkenntnisse mehr über 
Sprache aussagen zu wollen, als linguistisch angemessen erscheint, sei es, um 
Polizei und Justiz zu helfen, sei es, um sich der eigenen Bedeutsamkeit zu versi- 
chern. Hier offenbart sich die Kehrseite fehlender methodologischer Reflexion, 
die im forensischen Kontext mit seinen Konsequenzen für die beteiligten Sub- 
jekte ein ganz anderes Gewicht erhält und ihre Schatten auch auf die Disziplin 
als solche wirft. 

Die Möglichkeiten des interdisziplinären oder sogar transdisziplinären Zu- 
sammenarbeitens, diein anderen Konstellationen bereichern und einen Erkennt- 
niszuwachs bewirken, stoßen im forensischen Kontext an Grenzen, die durch die 
Zweckgebundenheit der jeweiligen wissenschaftlichen Arbeit definiert sind. Die 
Möglichkeiten eines auslotenden Erforschens sind damit deutlich stärker be- 
schränkt. Da linguistische Expertise anderen Wissensdomänen zuarbeitet, in de- 
nen sie sich Alltagskonzepten von Sprache gegenübersieht, legt sie im Grunde 
mit jedem Gutachten über die Methodik Rechenschaft ab und berührt - im Sinne 
eines Wissenstransfers — auch immer wieder methodologische Grundsatzfragen. 
Entgegen den Aufbruchstendenzen des Faches und möglicherweise auch entge- 
gen dem eigenen Selbstverständnis ist sie zu einer eher konservativen Haltung 
gezwungen, denn die Auflösung der Grenzen des Faches, die Neuverhandlung 
von Untersuchungsgegenständen einschließlich ihrer Interpretationen sowie der 
gewählten Methoden bedeuten in der Wahrnehmung anderer oft ein ‚anything 
goes‘, das Gefahr läuft, dem Vorwurf von ,junk science‘ den Weg zu bereiten. 
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In diesem Zusammenhang stellt der dritte von den Herausgebern genannte 
Punkt jedoch die eigentliche Herausforderung dar. Formen der automatisierten 
Auswertung von Sprache gelten zwar in der Linguistik als eine Methode unter 
vielen, deren Eignung und Anwendbarkeit durch den Untersuchungsgegenstand 
bestimmt ist, in technisch ausgerichteten Disziplinen gelten sie jedoch allein 
durch die Menge der auszuwertenden Daten oft als bereits gesetzt. Selten ist ein 
Bewusstsein dafür vorhanden, was diese Art der Auswertung von Sprache maxi- 
mal ergeben kann und wo ihre Grenzen liegen. Eine Reflexion dieses Zugangs in 
ausreichendem Maße erfolgt nicht, und es steht durchaus im Raum, dass das, 
was untersucht wird, ohne linguistische Betrachtung auskommt, wenn gerade 
die Verfahren, die theoretisch anspruchslos oder sogar theoriefrei sind, in den 
Augen ihrer Anwender besonders gute Ergebnisse erzielen. Existieren also Mög- 
lichkeiten der Sprachanalyse, die keiner Linguistik mehr bedürfen? Und wenn 
dem so wäre, wie würde man deren Ergebnisse wieder an linguistische Herme- 
neutiken anbinden? 

Gerade im Rahmen ihrer forensischen Anwendung steht die Linguistik damit 
vor der Herausforderung, die Deutungshoheit über Sprache neu einzufordern, in- 
dem sie sich zu den Methoden anderer Disziplinen und deren Angemessenheit 
gegenüber dem Untersuchungsgegenstand ‚Sprache‘ klar verhält. Insofern sind 
es methodologische Überlegungen, an die sich nicht zuletzt die Validität von Er- 
gebnissen knüpft, die an zentraler Stelle stehen und auf die sich zu besinnen Teil 
forensischer Standortbestimmung ist. 


Respondenz von John A. Bateman & 
Chiao-l Tseng 


Wie die Herausgeber deutlich machen, gibt es mehrere Erweiterungsdimensio- 
nen, die heute für die Neubewertung einiger grundlegender Fragen der Linguis- 
tik sehr relevant geworden sind, wie z.B. die grundlegendste von allen: Was ist 
Sprache? Die Antwort auf diese Frage hat sich im Laufe der Jahre verändert und 
erweitert, was mit einer ähnlichen Erweiterung der Methoden und der Beschrei- 
bungsansätze einherging. In unserem Beitrag untersuchen wir einige der Konse- 
quenzen solcher Erweiterungen im großen Bereich der Multimodalitat - d.h. dort, 
wo die Analysegegenstände nicht ausschließlich oder sogar nicht primär 
„sprachlich“ im traditionellen Sinne sind. Wir zeigen nicht nur, dass bestimmte, 
aus der Linguistik abgeleitete Diskursmechanismen sinnvoll auf nicht primär 
verbale Kommunikationsformen angewandt werden können, sondern auch, dass 
empirische Methoden, die aus empirischen Ansätzen zur Sprache und zum 
Sprachverständnis abgeleitet sind, zur kritischen Evaluierung solcher Behand- 
lungen herangezogen werden können. Dies macht deutlich, dass viele Parallelen 
zwischen enger gefassten „sprachlichen“ Verhaltensweisen und einer weitaus 
breiteren Klasse von Artefakten und Leistungen weit über eine bloß metaphori- 
sche Übertragung hinausgehen: Es scheinen tiefergehende Ähnlichkeiten (wie 
auch interessante Unterschiede) in der Verarbeitung, Struktur und Interpretation 
zu bestehen, die es aufzudecken gilt. Eine zunehmende Vielfalt von Ansätzen mit 
starker linguistischer Fundierung beschäftigt sich mit solchen Fragen, die von 
statischer und dynamischer visueller Kommunikation über Musik zu Tanz und 
vielem mehr reichen (vgl. z.B. Cohn et al. 2012; Zacks/Magliano 2011; Koelsch et 
al. 2004; Schlenker 2017; Patel-Grosz et al. 2019; u.v.m.). 

Ansätze dieser Art bringen notwendigerweise eine Vielzahl von Disziplinen 
in enge Interaktion und Kooperation. In der Tat ist im Bereich der Multimodalität 
die Frage der disziplinären Erweiterung und der optimalen Durchführung inter- 
disziplinärer Forschung ein wiederkehrendes Thema (vgl. z.B. van Leeuwen 
2005). Solche Bemühungen regen auch dazu an, die Ergebnisse in die laufenden 
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Diskussionen über den Anwendungsbereich linguistischer Methoden und Rah- 
menwerke im Allgemeinen einzubringen. Hier stellen sich viele Herausforderun- 
gen und noch ungelöste Fragen. Insbesondere kann man sich angesichts der viel- 
fältigen Dimensionen und Perspektiven — wie die Herausgeber des vorliegenden 
Bandes - fragen, wie die Ergebnisse miteinander in Verbindung gebracht werden 
können, d.h. wie es sich vermeiden lässt, dass inkommensurable Perspektiven ge- 
sammelt werden, die innerhalb bestimmter disziplinärer Ausrichtungen durchge- 
führt werden und sich mit scheinbar ganz unterschiedlichen Formen der Kom- 
munikation befassen, aber nicht in der Lage sind, die Hebelwirkung und den 
Transfer von Erkenntnissen zu unterstützen? 

Es gibt mehrere mehr oder wenige problematische Antworten auf diese Her- 
ausforderung. 

So hat die explosionsartige Zunahme des Zugangs zu Daten natürlich zu ei- 
ner zunehmenden Anwendung von „Big Data“-Ansätzen geführt, wodurch qua- 
litative Berichte leicht an den Rand oder in den Hintergrund gedrängt werden 
können. Obwohl Big-Data-Ansätze eine wichtige Ergänzung unseres Methoden- 
instrumentariums darstellen, gibt es Anzeichen, dass ihre Fähigkeiten begrenzt 
sind. Anzeichen dafür finden sich in der zunehmenden Erkenntnis, dass „erklär- 
bare künstliche Intelligenz“ (Explainable AI) erforderlich ist, um gelernte Modelle 
für ihre Nutzer verständlich zu machen und ihnen zu vertrauen: Die Öffnung der 
Blackbox erfordert qualitative Interpretationen. Pearl (2000) argumentiert nach- 
drücklich, dass solchen statistisch abgeleiteten Modellen das fehlt, was für ein 
wirkliches Verständnis in jedem Fall wesentlich ist: Vorstellungen von Kausali- 
tät. In semiotischer Hinsicht sind abgeleitete statistische Modelle bestenfalls Fäl- 
le von Peircescher Secondness, die semiotisch gesehen formal schwächer ist als 
die Thirdness, die für Interpretation und Verständnis erforderlich ist. Die Schlüs- 
selposition der Linguistik - und damit auch der Multimodalität - im Spannungs- 
feld zwischen Quantitativ und Qualitativ könnte sich als entscheidend für weitere 
Fortschritte erweisen. 

Ähnlich problematisch ist die in der Multimodalitätsforschung inzwischen 
häufig geäußerte Annahme, dass wir Sprache als „nur eine weitere“ Modalität 
betrachten sollten, die immer in einer mehr oder weniger komplexen Konstella- 
tion von Modi auftritt. Dies darf nicht darüber hinwegtäuschen, dass verschie- 
dene Modalitäten, einschließlich der Sprache, Eigenschaften haben können, die 
sich von den Eigenschaften anderer Modalitäten stark unterscheiden: Diese müs- 
sen alle angemessen erfasst und in Beziehung gesetzt werden. Während be- 
stimmte strukturelle und semantische Eigenschaften bei allen Ausdrucksformen 
Gemeinsamkeiten aufzuweisen scheinen, funktionieren diese Modalitäten in an- 
derer Hinsicht offenbar ganz anders. Saussures patron general darf weder zu 


Respondenz von John A. Bateman & Chiao-I Tseng — 317 


einer Zwangsjacke werden, noch dazu dienen, die individuellen Beiträge der ver- 
schiedenen Kommunikationsformen zu verwässern. Dies gilt auch für die Metho- 
den: Um der Komplexität der heutigen Kommunikationslandschaft gerecht zu 
werden, wäre es eine unnötige (und gefährliche) Einschränkung, wenn man die 
Methoden aus etablierten disziplinären Gründen einschränkt. Nicht alle Fragen 
lassen sich mit einem psychologischen Experiment, einer Korpusstudie oder ei- 
ner genauen Interaktionsanalyse beantworten — auch hier sind Vielfalt und mo- 
tivierte Kombinationen der Schlüssel. 

Wir sind der Ansicht, dass eine breit angelegte semiotische Darstellung, wie 
sie in unserem Beitrag dargelegt wird, einen wesentlichen Ordnungsrahmen bie- 
tet, der genau die erforderliche Vielfalt und Heterogenität von Methoden und A- 
nalyseobjekten ermöglicht und gleichzeitig eine methodologische und diszipli- 
näre Triangulation fördert. Obwohl sich unsere Darstellung in erster Linie darauf 
konzentriert, wie qualitative, diskursbasierte Beschreibungen von Analyseobjek- 
ten, die mit Begriffen der multimodalen Kohäsion umschrieben werden, mit em- 
pirischen, verhaltensbasierten und quantitativen Methoden wie Eyetracking und 
Brain Imaging verzahnt werden können, ist die Darstellung keineswegs auf diese 
Ansätze beschränkt. Im Wesentlichen muss versucht werden, Bereiche der „Ko- 
Beschreibung“ über Rahmen, Ansätze und Untersuchungsgegenstände hinweg 
zu definieren, so dass aus der Untersuchungstätigkeit eine Triangulation entste- 
hen kann; die Durchführung multi-, inter- und transdisziplinärer Arbeit kann 
dann aktiv ermöglicht und produktiv in spezifischen Forschungsfragen verankert 
werden, wodurch die systematische Vergleichbarkeit von Studien und Ergebnis- 
sen ohne Reduzierung auf einzelne Perspektiven erhöht wird. 

Natürlich sind Erweiterungen, wie wir sie jetzt in der Linguistik und ver- 
wandten Bereichen erleben, zu begrüßen. Die Auflösung traditioneller Grenzen 
zwischen Bereichen und Methoden, die solche Erweiterungen oft mit sich brin- 
gen, geht jedoch auch oft mit der Konstruktion neuer Grenzen der Praxis einher, 
die nicht unbedingt besser sind als die alten. Hier können grundlegendere theo- 
retische und philosophische Überlegungen hilfreich sein. In unserem eigenen 
Beitrag konzentrieren wir uns auf den verstärkten Einsatz einer neu belebten und 
im Wesentlichen multimodalen Semiotik zur Förderung solcher Ziele. Damit 
kann auch die Schlüsselfrage, was ist Sprache, mit neuen Mitteln angegangen 
werden. 
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Matthias Meiler, Martin Siefkes 
Zwölf Thesen zur linguistischen 
Methodendiskussion 


Zum Abschluss des Bandes 


Die folgenden Thesen sind als Positionierungen der beiden Herausgeber dieses 
Bandes zu verstehen. Naturgemäß sind solche Positionierungen standortgebun- 
den und folglich stets ergänzungsbedürftig. Es handelt sich um zugespitzte Be- 
schreibungen der gegenwärtigen Herausforderungen und Lösungsansätze für die 
Entwicklung der linguistischen Methodologie. Sie sollen nicht die Debatte ab- 
schließen, sondern vielmehr lediglich im Rückblick auf die im Band vertretenen 
Perspektiven noch einmal auf einige Punkte fokussieren, weitere Auseinander- 
setzungen (Zustimmung, Widerspruch, Ergänzungen) provozieren und das Ge- 
spräch offenhalten. 


I. 


II. 


Nach einem Jahrhundert zunehmender Ausdifferenzierung der linguis- 
tischen Disziplin in mittlerweile fest institutionalisierte Teildisziplinen 
besteht immer noch und wieder verstärkt Bedarf an der Verständigung 
über den Gegenstand der Sprachwissenschaft. Anzustreben ist ein Ge- 
genstandsverstandnis, das in der Lage ist, die etablierten Subdisziplinen 
zu reintegrieren, anstatt sie lediglich in parallelen Diskursen sich entwi- 
ckeln zu lassen. 

Die allerorten virulent werdenden Methodendiskussionen legen Zeugnis 
einer erneuten Verunsicherung des linguistischen Gegenstands und sei- 
ner Erfassbarkeit ab. Die Gründe dieser Verunsicherung liegen einerseits 
in der rasanten Entwicklung quantitativer Methoden, die dem Bereich 
der Digital Humanities zugeordnet werden können, andererseits in den 
sozialen und kulturellen Herausforderungen, die das digitale Zeitalter 
zunehmend entfaltet und dabei theoriegeschichtlich zumindest eines zur 
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II. 


IV. 


Folge hat: nämlich die Homogenitätsunterstellungen der großen Theo- 
rien des 19. und 20. Jahrhunderts (in Bezug etwa auf die Sprache, die 
Kultur, die Gesellschaft, die Medien) infrage zu stellen. 

Die Ergebnisse unterschiedlicher Methoden (unabhängig davon, ob sie 
den sog. qualitativen oder den sog. quantitativen zugeordnet werden 
können) bedürfen einer expliziten theoretischen Vermittlung: sowohl 
innerhalb einzelner Projekte, aber auch - und hier noch stärker - im in- 
tradisziplinären Austausch. Denn Methoden bringen stets ihre je eige- 
nen Gegenstände hervor. Da Methoden die Konstitution des jeweils un- 
tersuchten Gegenstands durch verschiedene Auswahl-, Erhebungs- und 
Transkriptionsverfahren ebenso grundlegend beeinflussen wie durch 
verschiedene theoretische Begriffsentscheidungen, bedarf die zuneh- 
mende Bandbreite von Methoden auch verstärkter Vermittlung der Er- 
gebnisse einzelner Untersuchungen untereinander. Die besondere Her- 
ausforderung einer solchen Vermittlungsarbeit besteht dabei auch in 
der wissenschaftssoziologischen Dimension der individuellen Ausein- 
andersetzung mit und Aneignung von Theorien und Methoden der 
Sprachbeschreibung im Laufe wissenschaftlicher Karrieren. 

Anstelle der früheren Theoriekämpfe (und damit stets auch verbunde- 
nen Methodenkonkurrenz) zwischen einzelnen linguistischen Schulen 
tritt zunehmend ein Pluralismus der gegenseitigen Toleranz und Akzep- 
tanz einer Reihe von linguistischen Schulen mit jeweils auf die spezifi- 
schen Fragestellungen ausgerichteten, in einer Vielzahl von Studien 
ausgefeilten und validierten Methoden. Diese Entwicklung ist grund- 
sätzlich zu begrüßen. Sie führt allerdings zusammen mit der generellen 
Erweiterung des Methodenspektrums (etwa durch die Digital Humanities, 
Big-Data-Verfahren, neue multimodale Erhebungsmethoden von Sprachda- 
ten usw.) zur Gefahr von „Ergebnisinseln“, deren jeweils durch ver- 
gleichbare Theorie- und Methodengrundlagen gekennzeichnete Ergeb- 
nisse irreduzibel von den gewählten Methoden abhängen. 

Die postulierte, durch den Methodenpluralismus bedingte und zuneh- 
mende Aufteilung linguistischer Forschung in „Ergebnisinseln“ führt zu 
zwei Problemen. (a) In theoretischer Hinsicht erschwert sie es, die Per- 
formanz von verschiedenen Theorien in Bezug auf bestimmte Fragestel- 
lungen gegeneinander abzuwägen, da fundamentale method(olog)ische 
Inkompatibilitäten einer Vergleichbarkeit im Wege stehen. Ohne Ver- 
gleichbarkeit gibt es jedoch auch keine Kriterien für eine angemessene 
Wahl und Entscheidungen werden schwer nachvollziehbar; Theorien 
und Methoden werden tendenziell zu einem Baukasten, aus dem man 


VI. 


VII. 
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sich nach persönlicher Präferenz bedienen kann, wobei das Ergebnis der 
Untersuchung von diesem Schritt in nicht transparenter Weise abhängt. 
(b) Noch schwerwiegender ist, dass die Ergebnisse von „Theorieinseln“ 
inkompatibel zu werden drohen. Das Ergebnis einer linguistischen Un- 
tersuchung hängt in zunehmendem Maße davon ab, welche Linguist* 
innen mit welchem methodischen Rüstzeug sich einer Fragestellung an- 
nehmen. Diese Entwicklung droht, die Validität eines allgemein akzep- 
tierten Forschungsstands der Linguistik in Frage zu stellen und der Re- 
putation der Disziplin nach außen zu schaden. 

Die zunehmende Tendenz zu Mixed-Methods-Ansätzen bietet einen viel- 
versprechenden Lösungsansatz, da hier mehrere Methoden kombiniert 
und ihre verschiedenen Perspektiven auf den Gegenstandsbereich trian- 
guliert werden. Allerdings ist dies mit neuen Gefahren verbunden, wenn 
etwa Methoden je nach vorhandenen Daten, beteiligten Forschungsin- 
stitutionen, Erfahrungsprofil beteiligter Forschungspartner*innen, Prä- 
ferenzen der Auftraggeber*innen usw. opportunistisch kombiniert wer- 
den. Durch die Kombination von Methoden kommt eine weitere Dimen- 
sion der Varianz und potentiellen Inkompatibilität von Ergebnissen hin- 
zu: etwa wenn, nur um ein Beispiel zu skizzieren, Ergebnisse einer auf Ko- 
okkurrenzanalysen basierenden Korpusstudie zu Hate speech auf Twitter 
anschließend einer Detailanalyse mit Kategorien der systemisch-funkti- 
onalen Linguistik unterzogen werden, wobei nun sowohl die Wahl des 
quantitativen Verfahrens wie auch die des qualitativen Analyseansatzes 
die gewonnenen Erkenntnisse auf nicht-offensichtliche Weise beeinflus- 
sen können, was die Vergleichbarkeit mit anderen Studien erschwert. 
Eine verstärkte Reflexion der Methodenwahl und stets eine explizite Be- 
griindung der jeweiligen Kombination ist also erforderlich. 

Es ist in methodologischer Hinsicht geboten, die Abhängigkeit von Er- 
gebnissen von der oder den gewählten Methode(n) genauer zu erfor- 
schen und zu reflektieren. Dies setzt allerdings umfassende empirische 
Forschung voraus. Anzustreben wäre etwa die erneute Durchführung re- 
levanter Studien mit anderen Methoden und/oder anderer Theoriegrund- 
lage, mit anschließendem Vergleich der Ergebnisse. Langfristig wäre un- 
ter anderem darauf hinzuarbeiten, „methodenrobuste“ Problemdimen- 
sionen, bei denen die Methodenwahl weniger einschneidende Konse- 
quenzen hat, von „methodensensiblen“ abzugrenzen, bei denen damit 
zu rechnen ist, dass unterschiedliche Methoden zu inkompatiblen Er- 
gebnissen führen. Auf diese Weise können Brücken zwischen Ergebnis- 
inseln gebaut werden, vor allem in den methodenrobusten Bereichen, 
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wo der Einfluss methodischer Entscheidungen in den Auswirkungen auf 
die gewonnenen Erkenntnisse abschätzbar ist. 

In besonders methodensensiblen Problemfeldern sollte die erwartete 
Abhängigkeit der Ergebnisse von der oder den gewählten Methode(n) 
verstärkt diskutiert und vergleichend untersucht werden. Auf diese Wie- 
se können - um in der Metapher zu bleiben - Fährverbindungen zwi- 
schen methodisch verschieden fundierten Ergebnisinseln entstehen, die 
bei gutem Wetter eine sichere Verbindung garantieren, unter widrigeren 
Bedingungen muss man indes vielleicht auf ein U-Boot umsteigen (und 
die Grundlagen inspizieren), um die Verbindung nicht gleich einstellen 
zu müssen. Damit wäre immerhin ein wichtiger Schritt hin zu einem 
transparenten Umgang mit der Methodenabhängigkeit konkreter Stu- 
dien getan. Die Verbunden- bzw. Unverbundenheit von Ergebnissen wür- 
den offengelegt und zugleich die Anreize dafür vergrößert, Forschung 
nicht nur in theoretischer Hinsicht, sondern auch bei der Methodenwahl 
und in der methodologischen Reflexion an vorhandene Ergebnisse an- 
zudocken. 

Eine rein geisteswissenschaftliche Linguistik ist daher heute in kaum ei- 
nem Bereich der Sprachwissenschaft mehr denkbar. Die Bezugnahme 
auf sprachliche und sprachbezogene Empirie, welche außerhalb der 
analysierenden Person liegt, entwickelt sich zunehmend zum epistemo- 
logischen Standard. Die Hinwendung zur Empirie bedarf jedoch stets 
auch einer dialektischen Gegenbewegung in der Theorie, welche die 
Passung von Begriff, Phänomen und Methode reflektiert, welche im Ge- 
genstand aufgehoben ist. Gerade angesichts der Jahrtausende alten und 
bekanntermaßen mit diversen Biases behafteten Theorie- und Termino- 
logiegeschichte der Sprachwissenschaft darf die Linguistik nicht ledig- 
lich daran arbeiten, ihre Methoden kontinuierlich zu verbessern und 
überkommene Theoreme und Termini unangetastet zu lassen. 

Unter anderem angesichts der interdisziplinären Multimodalitätsrevolu- 
tion stehen die üblichen Verfahren der analytischen Herauslösbarkeit 
von Sprache aus Ko- und Kontext, aber auch die Abgrenzung des Phä- 
nomens Sprache selbst ganz prinzipiell (und abermals) in Frage bzw. 
sind in Zweifel zu ziehen. Dies weist auch über den Zusammenhang mit 
Modalitäten/semiotic modes im engeren Sinne hinaus etwa auf Fragen 
materialer und distribuierter Agency in komplexen Ökologien kommuni- 
kativer Praktiken. 

Eine Erforschung von Sprache, welche über die Grenzen der Linguistik 
hinaus geht, wird sich zunehmend nicht nur für Forschungsteams, son- 
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dern auch für Einzelprojekte zum methodologischen Standard entwi- 
ckeln, um etwa den Forderungen nach gesellschaftlicher Relevanz, um 
der Anschlussfähigkeit an andere Disziplinen und schlicht um der As- 
pektheterogenität des Gegenstands angemessen zu entsprechen. Jede 
interdisziplinäre Begegnung birgt dabei die Konfrontation mit den eige- 
nen Grundannahmen und ihre Umperspektivierung in sich. Sich dem zu 
stellen, befördert nicht nur die methodologische Diskussion über ein- 
zelne Begriffe vom Gegenstand, sondern im Verein damit fördert es auch 
die Reflexion der methodischen Erfassung der Gegenstände. Vorstellun- 
gen von disziplinären Grenzen müssen dem hintangestellt werden. 

Als interdisziplinäre Rahmentheorien innerhalb derer die intraisziplinä- 
re Reintegration unternommen (werden) wird, stehen derzeit - mal mehr 
mal weniger explizit argumentativ entwickelt - vor allem Zeichen- und 
Praxistheorien zur Verfügung. Kandidaten für Rahmentheorien müssen 
sich unter anderem daran messen lassen, ob sie die Konstitutionsbedin- 
gungen ihres Gegenstandes kategorial reflektieren und methodisch zu- 
sänglich machen, und wie stark sich ihre Kategorienentwicklung dialek- 
tisch aus der empirischen Befassung mit dem Gegenstand ergibt. Dass 
es solcher Rahmentheorien durchaus bedarf, zeigt sich bereits innerhalb 
der Multimodalitätsforschung, wo naturgemäß der Zusammenhang bis- 
her disziplinär getrennt betrachteter Phänomene notorisch infrage steht. 
Solche Rahmentheorien zu erarbeiten, versetzt die Linguistik aber in je- 
dem Falle in die Lage, Ergebnisse unterschiedlicher Methoden zu relati- 
onieren und methodologisch plausibel zu integrieren. 
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